← 返回列表

一种考虑远帧依赖关系的多模态多目标3D跟踪方法及装置

申请号: CN202311459231.4
申请人: 扬州万方科技股份有限公司
申请日期: 2023/11/3

摘要文本

本发明属于3D多目标跟踪技术领域,提供了一种考虑远帧依赖关系的多模态多目标3D跟踪方法及装置。本跟踪方法包括以下步骤:获取多帧场景的RGB和3D点云信息;填充滑动窗口;将3D坐标对齐到可学习参数的3D坐标系;划分3D栅格,提取逐框3D特征;提取2D逐像素深层次特征并映射,提取逐框3D映射特征;查询向量表生成初始3D检测框表示;通过Transformer解码器同时预测多帧多目标检测框;进行各帧3D检测框的ID匹配;采用卡尔曼滤波器进行3D检测框的更新。本跟踪方法考虑了滑动窗口内多帧间的长距离上下文依赖关系,使用Transformer自动学习不同帧不同点间的特征权重,有效应对了跨多帧跟踪时的目标遮挡问题和目标丢失问题。

专利详细信息

项目 内容
专利名称 一种考虑远帧依赖关系的多模态多目标3D跟踪方法及装置
专利类型 发明申请
申请号 CN202311459231.4
申请日 2023/11/3
公告号 CN117576150A
公开日 2024/2/20
IPC主分类号 G06T7/246
权利人 扬州万方科技股份有限公司
发明人 周思远; 朱玉鹤; 周春云; 包敏
地址 江苏省扬州市广陵产业园安林路96号

专利主权项内容

1.一种考虑远帧依赖关系的多模态多目标3D跟踪方法,其特征在于,包括以下步骤:S1:获取多帧场景的RGB信息和3D点云信息;S2:在3D滑动窗口内填充跟踪场景到固定窗口大小;S3:将所述滑动窗口内的各帧3D坐标对齐到可学习参数的3D坐标系;S4:划分3D栅格,按照所述3D栅格提取逐框3D特征;S5:提取2DRGB逐像素深层次特征并映射到可学习参数的3D坐标系下,按照所述3D栅格提取逐框3D映射特征;S6:查询可学习参数的向量表生成初始3D检测框表示;S7:通过Transformer解码器同时预测多帧多目标检测框位置、大小、角度、类别概率;S8:采用匈牙利算法进行各帧所述3D检测框的ID匹配;S9:采用卡尔曼滤波器进行所述3D检测框的更新。