一种半监督的自然保护地遥感影像场景识别方法
申请人信息
- 申请人:深圳市森歌数据技术有限公司; 广东省林业调查规划院
- 申请人地址:518000 广东省深圳市南山区粤海街道滨海社区高新南十道81、83、85号深圳市软件产业基地1栋1402-B34
- 发明人: 深圳市森歌数据技术有限公司; 广东省林业调查规划院
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种半监督的自然保护地遥感影像场景识别方法 |
| 专利类型 | 发明申请 |
| 申请号 | CN202410170679.2 |
| 申请日 | 2024/2/6 |
| 公告号 | CN117710828A |
| 公开日 | 2024/3/15 |
| IPC主分类号 | G06V20/10 |
| 权利人 | 深圳市森歌数据技术有限公司; 广东省林业调查规划院 |
| 发明人 | 黄宁辉; 周皓然; 叶绍泽; 陆国锋; 陈康; 秦琳 |
| 地址 | 广东省深圳市南山区粤海街道滨海社区高新南十道81、83、85号深圳市软件产业基地1栋1402-B34; 广东省广州市广汕一路338号 |
摘要文本
本发明公开了一种半监督的自然保护地遥感影像场景识别方法,包括S1,构造数据集D,包括监督数据集DS和无监督数据集DU;选取一Resnet‑50,用于对输入的遥感影像进行特征提取并进行分类预测,输出其预测类别;设计监督数据损失LS、无监督数据损失LU和数据亲和损失LA;基于LS、LU、LA构造综合损失函数L,训练Resnet‑50得到场景识别模型;获取待识别遥感影像,输入场景识别模型中,输出其预测类别。本发明通过约束聚类和数据间亲和关系为神经网络学习中的无监督数据分配伪标签和学习权重,实现遥感影像的半监督场景识别,使场景识别模型在训练过程中无需依赖于大规模标签数据,节省标注时间。
专利主权项内容
1.一种半监督的自然保护地遥感影像场景识别方法,其特征在于:包括以下步骤;S1,构造数据集,包括监督数据集和无监督数据集;DDSDU获取s+u张自然保护地的遥感影像,对s张遥感影像的场景进行类别标注,并将类别作为对应遥感影像的标签,将s张带标签的遥感影像作为标注数据,构成,其余u张遥感影像作为无标注数据,构成,s<<u,类别数量为k;DSDUS2,选取一Resnet-50,所述Resnet-50包括一特征提取器和一分类器,用于对输入的遥感影像进行特征提取并进行分类预测,输出其预测类别;S3,设计监督数据损失;LS
, 式中,X为每次迭代时从数据集中选取的一批次数据构成的集合,为X中的遥感影像且来自于,/>为/>的标签,/>为Resnet-50的交叉熵损失函数,/>为/>的预测类别;DDSS4,设计无监督数据损失,包括步骤S41~S43;S41,采用约束k均值算法对数据集D进行聚类,得到k个与类别对应的聚类簇,为每个聚类簇内的无标注数据分配伪标签;S42,对每个聚类簇,根据其簇中心到无标注数据的距离,选取数个无标注数据,将所有聚类簇中选取的无标注数据及其伪标签构成数据子集;S43,根据下式得到无监督数据损失;LU
, 式中,为X中的遥感影像且来自于/>,/>为/>的伪标签,/>为/>的预测类别,为/>的权重;S5,设计数据亲和损失;LA将中任意2张遥感影像构成一组,计算其亲和性,对遥感影像和/>,根据下式得到数据亲和损失/>;X
, 式中,为/>和/>的亲和性,/>为L2范数计算;S6,构造综合损失函数,,式中,/>为的权重;LLAS7,预设总迭代次数N、批次大小,每次迭代从数据集D中读取一批次数据X训练Resnet-50,计算L并通过反向传播更新Resnet-50的权重,得到场景识别模型;S8,获取待识别遥感影像,输入场景识别模型中,输出其预测类别。 更多数据:搜索马克数据网来源: