← 返回列表

一种自监督360°深度估计方法、装置、设备及介质

申请号: CN202410232514.3
申请人: 深圳大学
更新日期: 2026-03-17

专利详细信息

项目 内容
专利名称 一种自监督360°深度估计方法、装置、设备及介质
专利类型 发明申请
申请号 CN202410232514.3
申请日 2024/3/1
公告号 CN117808857A
公开日 2024/4/2
IPC主分类号 G06T7/50
权利人 深圳大学
发明人 王旭; 何紫嫣; 张秋丹; 江健民
地址 广东省深圳市南山区南海大道3688号

摘要文本

本发明公开了一种自监督360°深度估计方法、装置、设备及介质,通过E2P变换将ERP图像转换成TP图像;将TP图像中失真最小的TP图像输入预设的骨干网络,在不同尺度提取TP特征块;根据频域空间域特征聚合模型提取TP特征块中的全局特征,并将其添加到原有的特征中,得到聚合了块内的非局部信息的聚合特征;将聚合特征分别输入TP域深度解码器和ERP域深度解码器中进行解码,得到TP域的深度图和对应置信图,ERP域的深度图,将TP域的深度图和ERP域的深度图融合得到融合图;采用球形视图合成从TP域的深度图、ERP域的深度图以及融合图分别生成新视点的视图,得到深度估计图。本申请方案能够提升深度估计的准确性。

专利主权项内容

1.一种自监督360°深度估计方法,其特征在于,所述方法包括:通过E2P变换将ERP图像转换成TP图像;将生成的TP图像中失真最小的个TP图像输入预设的骨干网络,在不同尺度提取个TP特征块;NpatchNpatch根据预设的频域空间域特征聚合模型提取个TP特征块中的全局特征,并将其添加到原有的特征中,得到聚合了块内的非局部信息的个聚合特征;NpatchNpatch将个聚合特征分别输入预设的TP域深度解码器和预设的ERP域深度解码器中进行解码,得到TP域的深度图和对应置信图,以及ERP域的深度图,将TP域的深度图和ERP域的深度图融合得到融合图;Npatch采用球形视图合成从TP域的深度图、ERP域的深度图以及融合图分别生成新视点的视图,得到深度估计图;其中,为正整数。Npatch