一种图像分割方法、系统、存储介质及设备
申请人信息
- 申请人:南京信息工程大学
- 申请人地址:210044 江苏省南京市江北新区宁六路219号
- 发明人: 南京信息工程大学
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种图像分割方法、系统、存储介质及设备 |
| 专利类型 | 发明授权 |
| 申请号 | CN202410085765.3 |
| 申请日 | 2024/1/22 |
| 公告号 | CN117611600B |
| 公开日 | 2024/3/29 |
| IPC主分类号 | G06T7/10 |
| 权利人 | 南京信息工程大学 |
| 发明人 | 李军侠; 李进盼 |
| 地址 | 江苏省南京市江北新区宁六路219号 |
摘要文本
本发明公开了一种图像分割方法、系统、存储介质及设备,本发明的分割模型分别采用Resnet50网络和Vision Transformer网络生成输入图像的第一CAM和第二CAM,将两个CAM中的值进行取最大值结合,基于结合后的第三CAM中每个类别的高鉴别性区域和低鉴别性区域,生成高鉴别性区域CAM和低鉴别性区域CAM,获得更均衡和更全面的分割结果,不会出现现有方法低覆盖率和准确性的问题。。关注公众号专利查询网
专利主权项内容
1.一种图像分割方法,其特征在于,包括:获取待分割的图像;将待分割的图像输入预先训练的分割模型,获得图像分割结果;其中,分割模型中的图像处理过程为:分别采用Resnet50网络和Vision Transformer网络,生成输入图像的第一类激活图和第二类激活图;其中,在生成第二类激活图的过程中,将一个卷积层输出的特征作为一个块的输入;卷积层为Resnet50网络的卷积层,块为Vision Transformer网络的块;遍历第一类激活图中的值,将第一类激活图中的值与第二类激活图中对应位置处的值进行比较,获取最大值;根据所有的最大值,生成第三类激活图;将第三类激活图中每个类别的高鉴别性区域作为掩码生成第一权重,根据拼接的卷积层输出特征和第一权重,生成Resnet50特征原型,对Resnet50特征原型和拼接的卷积层输出特征进行余弦相似性的计算,获得第一余弦相似度图,将第一余弦相似度图经过RELU函数处理,生成高鉴别性区域类激活图;将第三类激活图中每个类别的低鉴别性区域作为掩码生成第二权重,根据拼接的块输出特征和第二权重,生成Vision Transformer特征原型,对Vision Transformer特征原型和拼接的块输出特征进行余弦相似性的计算,获得第二余弦相似度图,将第二余弦相似度图经过RELU函数处理,生成低鉴别性区域类激活图;将高鉴别性区域类激活图和低鉴别性区域类激活图相加,获得最终的图像分割结果。。