一种基于单幅RGB图像的交互双手三维重建方法及系统
申请人信息
- 申请人:中国传媒大学
- 申请人地址:100024 北京市朝阳区定福庄东街1号
- 发明人: 中国传媒大学
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种基于单幅RGB图像的交互双手三维重建方法及系统 |
| 专利类型 | 发明申请 |
| 申请号 | CN202311371151.3 |
| 申请日 | 2023/10/23 |
| 公告号 | CN117333635A |
| 公开日 | 2024/1/2 |
| IPC主分类号 | G06T17/20 |
| 权利人 | 中国传媒大学 |
| 发明人 | 孟明; 柴剑平; 张浩楠 |
| 地址 | 北京市朝阳区定福庄东街1号 |
摘要文本
本发明提供一种基于单幅RGB图像的交互双手三维重建方法及系统,将单幅人体全身RGB图像分别传递给手部目标检测模块和手部语义分割模块,确定手部区域的位置和方向;手部语义分割模块根据手部目标检测模块标识出手部区域的位置和边界框,将单幅人体全身RGB图像分割成不同的语义区域;确定左手区域图像和右手区域图像的位置和边界框;同时利用语义分割模块的结果将手部区域分成左手区域图像和右手区域图像;利用变形卷积实现几何感知从左右手的区域图像中提取左右手的3D网格及2.5D姿态信息,计算左右手之间的相对位置关系,恢复交互双手的3D网格。本发明能够解决现有的交互双手三维重建方法重建效果差的问题,达到显著提升交互双手三维重建精度及效果。
专利主权项内容
1.一种基于单幅RGB图像的交互双手三维重建方法,其特征在于,所述三维重建方法包括:目标检测与语义分割预处理步骤:将待处理的单幅人体全身RGB图像分别传递给手部目标检测模块和手部语义分割模块;手部目标检测模块检测单幅人体全身图像中与手部相关的目标,标识出手部区域的位置和边界框,从而标识出的手部区域的位置和方向;手部语义分割模块根据手部目标检测模块标识出的手部区域的位置和边界框,将所述单幅人体全身RGB图像分割成包括手部区在内的不同的语义区域;左右手区域图像提取步骤:基于手部目标物体检测模块标识出的手部区域的位置和边界框,确定左手区域图像和右手区域图像的位置和边界框;同时,利用语义分割模块的结果,将手部区域分成左手区域图像和右手区域图像;基于几何感知的手部重建步骤:设计基于几何感知的手部重建模块,采用卷积神经网络从左手区域图像和右手的区域图像中提取左手与右手的3D网格及左手与右手的2.5D姿态信息;为了能够捕获手部的几何特征和形状变换,所述卷积神经网络中利用变形卷积实现几何感知;基于几何变换感知的相对位置细化模块:将所述左手与右手的2.5D姿态信息输入卷积神经网络中,利用卷积神经网络中的变形卷积进一步细化左手与右手的2.5D姿态信息,计算左手与右手之间的相对位置关系;交互双手3D网格恢复步骤:结合左手与右手的3D网格及左手与右手之间的相对位置关系,恢复交互双手的3D网格。