← 返回列表

一种基于CGLOW的全局优化的不平衡数据分类模型

申请号: CN202311727382.3
申请人: 中国矿业大学; 江苏华深智星智能科技有限公司
申请日期: 2023/12/14

摘要文本

本发明公开了一种基于CGLOW全局优化的不平衡数据分类模型,属于不平衡数据分类的领域。为了解决实际工业中某些类样本难以获取,造成数据不平衡影响最终分类效果的问题,我们希望以生成的方式补充少数类的样本达到样本平衡,因此我们在可逆卷积生成流模型GLOW的基础上提出了一种条件控制的GLOW, 即可以根据条件来生成各种类别的样本,针对不平衡数据集使用该模型生成更多的样本补充不平衡类别的数据,在此基础上建立了一套全局优化的模型框架,以resnet作为最终的分类器,借助resnet的特征提取能力,通过最终的分类损失引导CGLOW生成质量更高的样本,在整个训练过程中对CGLOW与resnet同时进行优化,为不平衡数据分类提供了一种端到端的解决方案。 来源:百度马 克 数据网

专利详细信息

项目 内容
专利名称 一种基于CGLOW的全局优化的不平衡数据分类模型
专利类型 发明申请
申请号 CN202311727382.3
申请日 2023/12/14
公告号 CN117726863A
公开日 2024/3/19
IPC主分类号 G06V10/764
权利人 中国矿业大学; 江苏华深智星智能科技有限公司
发明人 焦文华; 李俊雄; 蔡晓异; 朱永军; 马小平
地址 江苏省徐州市大学路1号; 江苏省徐州市贾汪区徐州工业园区中纬三路北侧、中经二路东侧

专利主权项内容

1.一种基于CGLOW全局优化的不平衡数据分类模型,其特征在于:包括以下步骤:S1:修改GLOW模型中的Z的先验分布,得到一种具有条件控制的CGLOW模型;S2:对带有标签的不平衡数据集进行简单的预先增广,使用正向CGLOW模型作为编码器,将预处理后的数据集成分批次的样本输入编码器进行计算,得到编码器的损失函数值,和n个类别的均值和方差向量;S3:依据编码器的损失函数,利用梯度下降算法计算梯度信息,当梯度反传时更新编码器的内部参数,对CGLOW进行一次优化;S4:利用不同类别的均值和方差进行重采样,得到每个类别对应的隐变量z,将逆向的CGLOW模型作为解码器,将隐变量z输入到解码器中,得到各类数量平衡的生成样本;S5:将生成样本输入分类器resnet中进行分类,得到分类结果,计算分类器的损失函数,当梯度反向传播的时候,梯度信息从分类器resnet传输到解码器中,由此完成一次分类器参数的更新和解码器的参数更新,实现对分类器的第一次优化和对CGLOW的第二次优化;S6:当CGLOW的损失函数值不再下降时,分类模型训练完成。