← 返回列表

一种肿瘤检测模型训练系统、方法、设备及存储介质

申请号: CN202311387239.4
申请人: 杭州汇健科技有限公司; 浙江大学
申请日期: 2023/10/25

摘要文本

本申请公开了一种肿瘤检测模型训练系统、方法、设备及存储介质,涉及模型训练技术领域,包括:待训练数据集获取模块,用于获取待训练数据集;模型训练模块,用于在当前训练周期中利用待训练数据集对初始模型进行训练得到训练后模型;数据样本筛选模块,用于当待训练数据集中的数据样本不小于预设数量时,筛选出低于预设可信度阈值的目标训练数据集;数据集更新模块,用于将目标训练数据集确定为下一训练周期的待训练数据集,并进行下一训练周期的训练过程;模型输出模块,用于当待训练数据集中的数据样本小于预设数量时,输出包含所有训练后模型的预设模型队列,并结合预设可信度阈值对待预测数据集进行预测。这样一来,本申请可以提高模型精度。 (来源 马克数据网)

专利详细信息

项目 内容
专利名称 一种肿瘤检测模型训练系统、方法、设备及存储介质
专利类型 发明申请
申请号 CN202311387239.4
申请日 2023/10/25
公告号 CN117349670A
公开日 2024/1/5
IPC主分类号 G06F18/214
权利人 杭州汇健科技有限公司; 浙江大学
发明人 余捷凯; 唐家琪; 王战鹏; 黄玮; 邬建敏; 栾春燕
地址 浙江省杭州市滨江区长河街道长河路475号3幢9层901室; 浙江省杭州市西湖区余杭塘路866号

专利主权项内容

1.一种肿瘤检测模型训练系统,其特征在于,包括:待训练数据集获取模块,用于获取待训练数据集;所述待训练数据集包括通过标签编码处理后的与肿瘤液体活检检测结果对应的数据样本;模型训练模块,用于在当前训练周期中,基于预设回归算法利用所述待训练数据集对初始模型进行训练,得到训练后模型;数据样本筛选模块,用于当所述待训练数据集中数据样本的数量不小于预设数量阈值时,基于预设交叉验证方式对所述待训练数据集中数据样本的可信度进行计算,以筛选得到可信度不大于预设可信度阈值的目标训练数据集;数据集更新模块,用于将所述目标训练数据集确定为下一训练周期的待训练数据集,并跳转至基于预设回归算法利用所述待训练数据集对初始模型进行训练,得到训练后模型的步骤,以进行所述下一训练周期的训练过程;模型输出模块,用于当所述待训练数据集中数据样本的数量小于所述预设数量阈值时,输出包含当前训练周期和此前所有训练周期对应的训练后模型的预设模型队列,以便利用所述预设模型队列中的模型以及所述预设可信度阈值对待预测数据集进行预测。