基于统一正负伪标签的无监督视觉表征学习方法及系统
申请人信息
- 申请人:哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院); 山东大学
- 申请人地址:518051 广东省深圳市南山区桃源街道深圳大学城哈尔滨工业大学校区
- 发明人: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院); 山东大学
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 基于统一正负伪标签的无监督视觉表征学习方法及系统 |
| 专利类型 | 发明授权 |
| 申请号 | CN202410077239.2 |
| 申请日 | 2024/1/19 |
| 公告号 | CN117611957B |
| 公开日 | 2024/3/29 |
| IPC主分类号 | G06V10/778 |
| 权利人 | 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院); 山东大学 |
| 发明人 | 吴建龙; 李子晗; 孙玮; 聂礼强; 尹建华; 林宙辰 |
| 地址 | 广东省深圳市南山区桃源街道深圳大学城哈尔滨工业大学校区; 山东省济南市历下区经十路17923号 |
摘要文本
本发明属于计算机视觉中的图像聚类技术领域,为解决现有图像聚类模型聚类性能低的问题,提供一种基于统一正负伪标签的无监督视觉表征学习方法及系统。其中,基于统一正负伪标签的无监督视觉表征学习方法包括预训练分配正标签的深度聚类模型;利用预训练的深度聚类模型为所有图像样本分配正标签,并从中筛选出一组正标签置信度高于设定阈值的图像样本;其中,将筛选出的图像样本作为有标签的图像样本,剩余的图像样本作为无标签的图像样本;利用预训练的深度聚类模型及所有图像样本再进行半监督调整,利用半监督调整过程中的学习损失对预训练的深度聚类模型进行联合优化训练,其能够在预训练模型的基础上进一步提升聚类性能。
专利主权项内容
1.一种基于统一正负伪标签的无监督视觉表征学习方法,其特征在于,包括:预训练分配正标签的深度聚类模型;利用预训练的深度聚类模型为所有图像样本分配正标签,并从中筛选出一组正标签置信度高于设定阈值的图像样本;其中,将筛选出的图像样本作为有标签的图像样本,剩余的图像样本作为无标签的图像样本;利用预训练的深度聚类模型及所有图像样本再进行半监督调整,利用半监督调整过程中的学习损失对预训练的深度聚类模型进行联合优化训练;其中,半监督调整的过程为:对有标签的图像样本,进行有监督学习,得到监督学习损失;对无标签的图像样本,利用自适应的正负伪标签阈值策略以及K-means聚类生成伪标签并进行伪标签学习,得到伪标签学习损失;由监督学习损失与伪标签学习损失构成半监督调整过程中的学习损失;对无标签的图像样本,利用自适应的正负伪标签阈值策略生成伪标签的过程为:当图像样本的最大概率超过正阈值时,最大概率对应的类别将作为该图像样本的正伪标签;反之,当图像样本的某些概率低于负阈值时,这些概率对应的类别均将作为该图像样本的负伪标签;其中,所述自适应的正负伪标签阈值策略根据深度聚类模型的训练状态自动调节正阈值及负阈值的大小;若深度聚类模型为基于聚类头的深度聚类模型,对于无标签的图像样本,使用聚类头得到的弱扩充样本预测概率进行自适应动态更新负阈值,过程为:在一个批次样本中,除去最大概率的所有概率之和的均值更新全局阈值;在一个批次样本中,将除去最大概率的不同类别的预测概率期望作为衡量该类别学习状况的标准,作为局部学习状况;使用全局阈值以及归一化后的局部学习状况之积作为负阈值;针对同一标签类别的正阈值的计算过程为:计算同一标签类别的所有维度的负阈值之和,得到负阈值累加值;再利用1减去上述负阈值累加值,得到相应正阈值。