← 返回列表
一种图像识别方法、装置、设备以及存储介质
申请人信息
- 申请人:腾讯科技(深圳)有限公司
- 申请人地址:518057 广东省深圳市南山区高新区科技中一路腾讯大厦35层
- 发明人: 腾讯科技(深圳)有限公司
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种图像识别方法、装置、设备以及存储介质 |
| 专利类型 | 发明申请 |
| 申请号 | CN202410055633.6 |
| 申请日 | 2024/1/15 |
| 公告号 | CN117576535A |
| 公开日 | 2024/2/20 |
| IPC主分类号 | G06V10/80 |
| 权利人 | 腾讯科技(深圳)有限公司 |
| 发明人 | 顾智浩; 张江宁; 王亚彪 |
| 地址 | 广东省深圳市南山区高新区科技中一路腾讯大厦35层 |
摘要文本
本申请实施例提供了一种图像识别方法,用于提高对工业图像缺陷的识别准确度。可应用于人工智能、云技术、交通领域等领域。包括:获取待识别对象的主模态图像以及至少一个辅模态图像;调用教师网络对主模态图像进行特征提取得到包括N个不同尺度的特征图的第一特征图集合,并调用教师网络对辅模态图像进行特征提取得到包括N个不同尺度的特征图的第二特征图集合,教师网络为预训练模型;将第一特征图集合与第二特征图集合进行特征融合得到第一多模态特征图集合;调用学生网络基于第一特征图集合和第二特征图集合进行重建,以得到第二多模态特征图集合;根据第一多模态特征图集合和第二多模态特征图集合进行比对,以识别得到待识别对象的缺陷。
专利主权项内容
1.一种图像识别方法,其特征在于,包括:获取待识别对象的主模态图像以及至少一个辅模态图像;调用教师网络对所述主模态图像进行N层特征提取得到第一特征图集合,并调用所述教师网络对所述至少一个辅模态图像进行N层特征提取得到第二特征图集合,所述教师网络为预训练模型,所述第一特征图集合包括N个不同尺度的特征图,所述第二特征图集合包括N个不同尺度的特征图,所述N为正整数;将所述第一特征图集合与所述第二特征图集合进行特征融合,以得到所述待识别对象的第一多模态特征图集合;调用学生网络基于所述第一特征图集合和所述第二特征图集合进行特征重构,以得到第二多模态特征图集合;根据所述第一多模态特征图集合和所述第二多模态特征图集合进行特征比对,以得到所述待识别对象的识别结果。