← 返回列表

一种基于过采样策略的带噪标签样本筛选学习方法及系统

申请号: CN202311415172.0
申请人: 江苏开放大学(江苏城市职业学院)
更新日期: 2026-03-10

专利详细信息

项目 内容
专利名称 一种基于过采样策略的带噪标签样本筛选学习方法及系统
专利类型 发明申请
申请号 CN202311415172.0
申请日 2023/10/27
公告号 CN117421657A
公开日 2024/1/19
IPC主分类号 G06F18/241
权利人 江苏开放大学(江苏城市职业学院)
发明人 张迁; 朱祎; 杨明; 陈虬
地址 江苏省南京市鼓楼区江东北路399号

摘要文本

本发明涉及一种基于过采样策略的带噪标签样本筛选学习方法及系统,包括以下步骤:步骤1、基于原始的噪声标签数据集,利用联合损失函数预训练具有基础分类性能的DNN模型;步骤2、预训练结束后,对原始噪声数据集中的样本迭代计算JSD损失,基于JSD损失进行均匀筛选,输出DNN模型的有标签子集和无标签子集;步骤3、利用半监督技术结合对比学习方法,基于步骤2输出的有标签子集和无标签子集,对DNN模型进行半监督鲁棒性训练,其中使用过采样技术使DNN模型对无标签子集的样本进行充分学习。本发明可以最大化利用无标签样本携带的特征表示信息,本发明的模型可以更快收敛并在高噪声率下取得更优性能。

专利主权项内容

1.一种基于过采样策略的带噪标签样本筛选学习方法,其特征在于,包括以下步骤:步骤1、基于原始的噪声标签数据集,利用联合损失函数预训练具有基础分类性能的DNN模型;步骤2、预训练结束后,对原始噪声数据集中的样本迭代计算JSD损失,基于JSD损失进行均匀筛选,输出DNN模型的有标签子集和无标签子集;步骤3、利用半监督技术结合对比学习方法,基于步骤2输出的有标签子集和无标签子集,对DNN模型进行半监督鲁棒性训练,其中使用过采样技术使DNN模型对无标签子集的样本进行充分学习。