基于超图文本对比的水下动作识别方法、系统及存储介质

申请号: CN202410130129.8

申请人: 吉林大学

申请日期: 2024/1/31

摘要文本

本发明属于水下动作识别技术领域，本发明公开了基于超图文本对比的水下动作识别方法、系统及存储介质，包括以下步骤：获取水下动作基准数据集；基于姿态估计法提取水下各种动作指令下的水下人体骨骼数据；对基本人体骨骼进行分区设计，建立关于骨骼关节点的超边，进而获得超图；将所述超图和所述水下人体骨骼数据进行结合，输出水下骨骼的超边特征；基于Transformer模型，输出骨骼特征，将所述骨骼特征和所述文本模型中的文本特征进行对比学习，最终输出精确的潜水员动作指令识别结果。本发明，将超图与输入特征结合推到超边特征，采用文本编码器生成文本特征，实现骨骼‑文本的对比学习，有效地利用多模态信息进一步提升潜水员动作识别的效能。

申请人信息

申请人:吉林大学
申请人地址:130012 吉林省长春市前进大街2699号
发明人: 吉林大学

专利详细信息

项目	内容
专利名称	基于超图文本对比的水下动作识别方法、系统及存储介质
专利类型	发明申请
申请号	CN202410130129.8
申请日	2024/1/31
公告号	CN117690190A
公开日	2024/3/12
IPC主分类号	G06V40/20
权利人	吉林大学
发明人	姜宇; 魏枫林; 王凯; 齐红; 赵明浩; 张永霁; 夏雨桐
地址	吉林省长春市前进大街2699号

专利主权项内容

1.基于超图文本对比的水下动作识别方法，其特征在于，包括以下步骤：获取潜水员水下动作彩色图像，作为水下动作基准数据集；基于姿态估计法对所述水下动作基准数据集进行处理，提取水下各种动作指令下的水下人体骨骼数据；对基本人体骨骼基于人体动力学进行分区设计，建立关于骨骼关节点的超边，进而获得超图；将所述超图和所述水下人体骨骼数据进行结合，输出水下骨骼的超边特征；预设计超图自注意力机制模块和多尺度时间卷积模块，基于包含所述超图自注意力机制模块和所述多尺度时间卷积模块的Transformer模型，输出骨骼特征，其中所述Transformer模型以所述超边特征为输入；基于VIT-B模型加载文本模型，并将所述骨骼特征和所述文本模型中的文本特征进行对比学习，最终输出精确的潜水员动作指令识别结果；其中，所得人体骨骼数据中关节点共有25个，骨骼分区表达式为：
；所述骨骼关节点的超边表达式为：
；其中，表示关节点v不属于超边e，/>表示该关节点v属于该超边，由此获得超图/>；其中，R表示一个25行，5列的矩阵；所述超边特征表达式为：
；其中，是超边逆度矩阵；/>是输入特征；/>是权重矩阵；/>是推导出的所述超边特征。

基于超图文本对比的水下动作识别方法、系统及存储介质

摘要文本

申请人信息

专利详细信息

专利主权项内容

热门技术领域

快速入口

专利技术资料

基于超图文本对比的水下动作识别方法、系统及存储介质

摘要文本

申请人信息

专利详细信息

专利主权项内容

相关专利推荐

一种全光产品的质量检测方法及系统

一种3D打印机脱料装置

一种基于试验数据库的压气机性能仿真程序精度评估方法

一种基于灰盒模型的节流阀响应预测方法

一种用于水性工业漆的加工装置

双辐板涡轮盘

热门技术领域

快速入口

专利技术资料