基于血常规的协同训练共享多模型在肺结核分类中的应用
摘要文本
。本发明公开了一种基于血常规的协同训练共享多模型在肺结核分类中的应用,属于数据分类技术领域,包括以下步骤:(1)获取血常规数据集,(2)通过多层感知机的神经网络构建基于血常规数据的协同训练共享多模型;(3)使用训练好的基于血常规的协同训练共享多模型对验证集Y进行验证。本发明采用上述的一种基于血常规的协同训练共享多模型在肺结核分类中的应用,解决标准数据样本数量少的问题,采用了半监督的模型构建方式,通过少量的标准数据即可构建模型,解决了医疗数据集精度差、获取数据数量少的问题。
申请人信息
- 申请人:内蒙古卫数数据科技有限公司
- 申请人地址:010010 内蒙古自治区呼和浩特市内蒙古呼和浩特赛罕区晨光路2号呼和浩特科创中心10层北区1007
- 发明人: 内蒙古卫数数据科技有限公司
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 基于血常规的协同训练共享多模型在肺结核分类中的应用 |
| 专利类型 | 发明申请 |
| 申请号 | CN202410135784.2 |
| 申请日 | 2024/1/31 |
| 公告号 | CN117828478A |
| 公开日 | 2024/4/5 |
| IPC主分类号 | G06F18/2415 |
| 权利人 | 内蒙古卫数数据科技有限公司 |
| 发明人 | 陈超; 宋彪; 张子诚; 韩泽文 |
| 地址 | 内蒙古自治区呼和浩特市内蒙古呼和浩特赛罕区晨光路2号呼和浩特科创中心10层北区1007 |
专利主权项内容
1.一种基于血常规的协同训练共享多模型在肺结核分类中的应用,其特征在于,包括以下步骤:(1)获取血常规数据集,包含有标签的标准数据集S1和无标签的非标准数据集S2,有标签的标准数据集S1:无标签的非标准数据集S2的数据比例为1:11,有标签的标准数据集S1中阴性阳性比例为2:1,无标签的非标准数据集S2中无法判定阴性阳性;验证集Y有已被验证的阳性、阴性数据,验证集Y与有标签的标准数据集S1的比例分别为1:10;(2)通过多层感知机的神经网络构建基于血常规数据的协同训练共享多模型,具体操作为:构建多个模型,包括基础model、mode1_1、mode1_2、mode1_3;将有标签的标准数据集S1分别输入基础model、mode1_2、mode1_3网络模型,无标签的非标准数据集S2分别输入基础model、mode1_1网络模型,基础model网络有两个输入,同时训练网络参数;有标签的标准数据集S1输入的基础mode1输出为pred_1;无标签的非标准数据集S2输入的基础model输出为pred_2;无标签的非标准数据集S2输入的mode1_1输出为pred_3;有标签的标准数据集S1输入的mode1_2输出为pred_4;有标签的标准数据集S1输入的mode1_3输出为pred_5;通过有标签的标准数据集S1和无标签的非标准数据集S2训练基于血常规的协同训练共享多模型,保留基础model,即为训练好的血常规数据的协同训练共享多模型;(3)使用训练好的基于血常规的协同训练共享多模型对验证集Y进行验证。