← 返回列表

一种基于6D姿态估计的三支流双向融合网络方法

申请号: CN202410148631.1
申请人: 南昌航空大学
更新日期: 2026-03-20

专利详细信息

项目 内容
专利名称 一种基于6D姿态估计的三支流双向融合网络方法
专利类型 发明申请
申请号 CN202410148631.1
申请日 2024/2/2
公告号 CN117689990A
公开日 2024/3/12
IPC主分类号 G06V10/80
权利人 南昌航空大学
发明人 严杰; 缪君; 吴皓杰; 王佳勋
地址 江西省南昌市丰和南大道696号

摘要文本

本发明公开了一种基于6D姿态估计的三支流双向融合网络方法,属于图像处理领域,包括:对RGB图像进行语义分割,从RGB图像进行输入,裁剪需要预测的目标对象,获取目标对象的彩色图像和深度图像,并将深度图像转换为点云;对S1中的彩色图像和深度图像进行特征提取和融合,构建RGB分支、深度分支及融合分支三个并行分支对特征进行提取和充分融合;将S2中提取的特征输入到姿态估计网络,估计每个中心点的特征的3D平移姿态和3D旋转姿态,并输出最高置信度的姿态。本发明采用上述的一种基于6D姿态估计的三支流双向融合网络方法,不仅可以保留原始RGB和深度分支的特征信息,还可以充分利用融合分支的特征,尽可能减小RGB和深度图像之间的特征差异。

专利主权项内容

1.一种基于6D姿态估计的三支流双向融合网络方法,其特征在于,包括以下步骤:S1、对RGB图像进行语义分割,从RGB图像进行输入,裁剪需要预测的目标对象,获取目标对象的彩色图像和深度图像,并将深度图像转换为点云;S2、对S1中的彩色图像和深度图像进行特征提取和融合,构建RGB分支、深度分支及融合分支三个并行分支对特征进行提取和充分融合;S3、将S2中提取的特征输入到姿态估计网络,估计每个中心点的特征的3D平移姿态和3D旋转姿态,并输出最高置信度的姿态。