一种基于扩张卷积和密集连接的镜头边界检测方法
申请人信息
- 申请人:南京邮电大学
- 申请人地址:210023 江苏省南京市栖霞区文苑路9号
- 发明人: 南京邮电大学
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种基于扩张卷积和密集连接的镜头边界检测方法 |
| 专利类型 | 发明授权 |
| 申请号 | CN202311799128.4 |
| 申请日 | 2023/12/26 |
| 公告号 | CN117456431B |
| 公开日 | 2024/3/26 |
| IPC主分类号 | G06V20/40 |
| 权利人 | 南京邮电大学 |
| 发明人 | 陈丹伟; 林道阳; 纪翀; 罗圣美 |
| 地址 | 江苏省南京市栖霞区文苑路9号 |
摘要文本
南京邮电大学取得“一种透气窗帘布”专利技术,本发明涉及视频检索领域,尤其是涉及一种基于扩张卷积和密集连接的镜头边界检测方法。所述检测方法包括如下步骤:对视频进行预处理,将视频的帧转换为48×27像素大小,这样做计算量相对较小,可以加快模型的训练速度,并减少过拟合。对于训练集,训练脚本随机选择包含注释过渡的100帧序列。将处理后的帧序列输入训练好的神经网络模型;模型输出每一帧的镜头边界概率,根据设定的阈值得到镜头边界帧,用于分割镜头。本发明通过在视频帧上运用卷积神经网络,准确判定镜头边界,实现视频分割,有利于视频管理和检索。本发明所涉及方法综合运用扩张卷积、自注意力和密集连接等技术,强化了特征提取和传递,提高了镜头边界检测的准确性和效率。
专利主权项内容
1.一种基于扩张卷积和密集连接的镜头边界检测方法,其特征在于,所述检测方法包括如下步骤:步骤S1、对视频进行预处理,将视频的帧转换为48×27像素大小;步骤S2、对于训练集,训练脚本随机选择包含注释过渡的100帧序列;步骤S3、将处理后的帧序列输入训练好的神经网络模型;步骤S4、模型输出每一帧的镜头边界概率,根据设定的阈值得到镜头边界帧;步骤S5、根据S4的镜头边界帧分割镜头;所述神经网络模型包含三个通过密集链接卷积网络链接的SDCNN单元;所述SDCNN单元内部,包含了两个DDCNN层与一个空间平均池化层;所述DDCNN层有三种,分别为DDCNNA、DDCNNB和DDCNNC,每个SDCNN单元可以根据情况选择任意两个作为DDCNN层;所述DDCNN层包括两个扩张卷积层,在时间维度上采用了不同的扩张率,并在通道维度上连接;其中,DDCNNA将三维K×K×K卷积分解成2维K×K空间卷积以及核大小为K的一维时间卷积,DDCNNB在DDCNNA的基础上采用一个共享的二维卷积,而不是空间二维卷积的多个分支,DDCNNC与DDCNNA相比,使用3D深度可分离卷积代替了三维展开的卷积。