← 返回列表

一种红外偏振成像数据的水下目标细粒度分类方法

申请号: CN202410182760.2
申请人: 吉林大学
申请日期: 2024/2/19

摘要文本

本发明属于水下机器视觉技术领域,本发明公开了一种红外偏振成像数据的水下目标细粒度分类方法,包括以下步骤:基于偏振相机获取图像构建水下基准数据集;利用交叠的滑动窗口对所述水下基准数据集中的所述红外偏振图像进行划分并编码,得到编码结果,并输入预训练视觉变换器编码器的共L层变换器层中,得到多层级的视觉特征和多层级的注意力图;利用前L‑1层每一层级的所述注意力图对自注意动态加权得到多层级动态注意力权重,并进行特征选择,得到特征组1;利用前L‑1层每一层级的注意力图对每一层级的特征进行前k个选择,得到多层级优化特征组2;将特征组1和特征组2输入第L层变换器层中,利用类别序列通过全连接层计算最终的类别。

专利详细信息

项目 内容
专利名称 一种红外偏振成像数据的水下目标细粒度分类方法
专利类型 发明申请
申请号 CN202410182760.2
申请日 2024/2/19
公告号 CN117746227A
公开日 2024/3/22
IPC主分类号 G06V20/05
权利人 吉林大学
发明人 姜宇; 张永霁; 魏枫林; 赵明浩; 齐红; 王跃航; 郭千仞
地址 吉林省长春市长春高新技术产业开发区前进大街2699号

专利主权项内容

1.一种红外偏振成像数据的水下目标细粒度分类方法,其特征在于,包括以下步骤:基于偏振相机获取的水下红外偏振图像构建水下基准数据集;利用交叠的滑动窗口对所述水下基准数据集中的所述红外偏振图像进行划分并编码,得到编码结果;将所述编码结果输入预训练视觉Transformer变换器编码器的共L层Transformer变换器层中,得到多层级的视觉特征和多层级的注意力图;利用第1至L-1层每一层级的所述注意力图对自注意动态加权得到多层级动态注意力权重,并进行特征选择,得到特征组1;利用第1至L-1层每一层级的所述注意力图对每一层级的特征进行前k个选择,得到多层级优化特征组2;将所述特征组1和所述特征组2输入所述视觉Transformer变换器编码器的第L层Transformer变换器层中,利用类别序列通过全连接层计算最终的类别。