一种基于扩张卷积和密集连接的镜头边界检测方法

申请号: CN202311799128.4

申请人: 南京邮电大学

更新日期: 2026-03-09

摘要文本

南京邮电大学取得“一种透气窗帘布”专利技术，本发明涉及视频检索领域，尤其是涉及一种基于扩张卷积和密集连接的镜头边界检测方法。所述检测方法包括如下步骤：对视频进行预处理，将视频的帧转换为48×27像素大小，这样做计算量相对较小，可以加快模型的训练速度，并减少过拟合。对于训练集，训练脚本随机选择包含注释过渡的100帧序列。将处理后的帧序列输入训练好的神经网络模型；模型输出每一帧的镜头边界概率，根据设定的阈值得到镜头边界帧，用于分割镜头。本发明通过在视频帧上运用卷积神经网络，准确判定镜头边界，实现视频分割，有利于视频管理和检索。本发明所涉及方法综合运用扩张卷积、自注意力和密集连接等技术，强化了特征提取和传递，提高了镜头边界检测的准确性和效率。

专利主权项内容

1.一种基于扩张卷积和密集连接的镜头边界检测方法，其特征在于，所述检测方法包括如下步骤：步骤S1、对视频进行预处理，将视频的帧转换为48×27像素大小；步骤S2、对于训练集，训练脚本随机选择包含注释过渡的100帧序列；步骤S3、将处理后的帧序列输入训练好的神经网络模型；步骤S4、模型输出每一帧的镜头边界概率，根据设定的阈值得到镜头边界帧；步骤S5、根据S4的镜头边界帧分割镜头；所述神经网络模型包含三个通过密集链接卷积网络链接的SDCNN单元；所述SDCNN单元内部，包含了两个DDCNN层与一个空间平均池化层；所述DDCNN层有三种，分别为DDCNNA、DDCNNB和DDCNNC，每个SDCNN单元可以根据情况选择任意两个作为DDCNN层；所述DDCNN层包括两个扩张卷积层，在时间维度上采用了不同的扩张率，并在通道维度上连接；其中，DDCNNA将三维K×K×K卷积分解成2维K×K空间卷积以及核大小为K的一维时间卷积，DDCNNB在DDCNNA的基础上采用一个共享的二维卷积，而不是空间二维卷积的多个分支，DDCNNC与DDCNNA相比，使用3D深度可分离卷积代替了三维展开的卷积。

专利申请信息

项目	内容
专利名称	一种基于扩张卷积和密集连接的镜头边界检测方法
专利类型	发明授权
申请号	CN202311799128.4
申请日	2023/12/26
公告号	CN117456431B
公开日	2024/3/26
IPC主分类号	G06V20/40
权利人	南京邮电大学
发明人	陈丹伟; 林道阳; 纪翀; 罗圣美
地址	江苏省南京市栖霞区文苑路9号

一种基于扩张卷积和密集连接的镜头边界检测方法

摘要文本

专利主权项内容

专利申请信息

热门技术领域

快速入口

专利技术资料

一种基于扩张卷积和密集连接的镜头边界检测方法

摘要文本

专利主权项内容

专利申请信息

相关专利推荐

一种VOC催化氧化还原实验装置及其实验方法

温敏型碱性蛋白酶变体及其应用

一种多目标追踪方法及系统

一种基于供需自主匹配算法的能力验证系统及方法

一种基于人工神经网络的立式淤泥脱水系统及脱水方法

结合反绎学习与深度学习的免疫固定电泳图像识别方法

热门技术领域

快速入口

专利技术资料