← 返回列表

基于动作识别和序列推理的动作预测方法

申请号: CN202311833547.5
申请人: 天津大学
更新日期: 2026-03-09

专利详细信息

项目 内容
专利名称 基于动作识别和序列推理的动作预测方法
专利类型 发明申请
申请号 CN202311833547.5
申请日 2023/12/28
公告号 CN117558067A
公开日 2024/2/13
IPC主分类号 G06V40/20
权利人 天津大学
发明人 刘鑫; 郝超; 岳焕景; 杨敬钰
地址 天津市津南区海河教育园雅观路135号天津大学北洋园校区

摘要文本

本发明公开了基于动作识别和序列推理的动作预测方法,步骤:对原始长视频数据预处理,得动作标签序列;将视频片段序列中的视频片段分别送入动作识别网络,提取代表视频片段的动作特征,得动作特征序列;将动作特征序列送入线性分类网络,得动作识别损失函数;将动作特征序列送入因果网络,得预测的下一个动作特征序列,再将下一个动作特征序列送入线性分类网络,得动作预测损失函数;将动作识别损失函数和动作预测损失函数相加,得网络总损失函数,优化网络参数。本发明使用动作识别损失和预测损失联合训练网络,降低了训练难度;用AIM模型和GPT2模型组成ARR主干网络,通过训练模型解决了网络性能较差和泛化性不足的问题。。更多数据:搜索专利查询网来源:

专利主权项内容

1.基于动作识别和序列推理的动作预测方法,其特征在于,包括以下步骤:S1、对原始长视频数据进行预处理,得到动作标签序列;S2、将视频片段序列中的每个视频片段分别送入动作识别网络,提取代表各个视频片段的动作特征,得到动作特征序列;S3、将动作特征序列送入线性分类网络,得到每个视频片段的动作分类结果,使用交叉熵损失函数来进行监督动作识别任务,使用动作标签序列进行监督,得到动作识别损失函数;S4、将动作特征序列送入因果网络,根据动作特征序列预测下一个动作,得到预测的下一个动作特征序列;将下一个动作特征序列送入线性分类网络,使用交叉熵损失函数来进行监督动作预测任务,将下一个动作特征用于分类,使用下一个动作标签序列进行监督,得到动作预测损失函数;S5、将得到的动作识别损失和动作预测损失相加,得到网络总损失函数,使用所得总损失函数来计算梯度,优化网络参数。。来源:马 克 团 队