← 返回列表

视频动作分类方法、装置、设备和存储介质

申请号: CN202410232129.9
申请人: 鹏城实验室
更新日期: 2026-03-17

专利详细信息

项目 内容
专利名称 视频动作分类方法、装置、设备和存储介质
专利类型 发明申请
申请号 CN202410232129.9
申请日 2024/3/1
公告号 CN117809381A
公开日 2024/4/2
IPC主分类号 G06V40/20
权利人 鹏城实验室
发明人 余柳涛; 马征宇; 周陈林; 叶钰敏; 黄力炜; 张晗; 周晖晖; 田永鸿
地址 广东省深圳市南山区兴科一街2号

摘要文本

本申请实施例提供视频动作分类方法、装置、设备和存储介质,涉及图像处理技术领域。该方法依次在每个时间步选取目标视频帧,调用依次级联的局部时空特征模块对目标视频帧进行脉冲编码后,再进行特征提取得到局部时空特征,调用依次级联的全局时空特征模块对局部时空特征进行脉冲编码后,再进行特征提取得到全局时空特征,利用循环神经网络模块从全局时空特征中提取分类时空特征,对分类时空特征进行分类预测得到视频动作分类结果。在特征提取过程中对输入的数据进行脉冲编码,将特征提取过程中乘法运算变为加法运算,降低网络处理过程的运算复杂度,尤其是在长时视频的场景下,能够减少运算时间,提升运算效率。

专利主权项内容

1.一种视频动作分类方法,其特征在于,包括:获取多个待处理视频帧,依次在每个时间步选取一个所述待处理视频帧作为目标视频帧;调用依次级联的局部时空特征模块对所述目标视频帧进行脉冲编码后,再进行特征提取,得到最后一个所述局部时空特征模块输出的局部时空特征;调用依次级联的全局时空特征模块对所述局部时空特征进行脉冲编码后,再进行特征提取,得到最后一个所述全局时空特征模块输出的全局时空特征;利用循环神经网络模块从所述全局时空特征中提取分类时空特征;将所述分类时空特征输入分类模块进行分类预测,得到视频动作分类结果。 来自:马 克 团 队