← 返回列表

一种用于早期肝癌术后复发风险预测的方法及系统

申请号: CN202311779195.X
申请人: 南京普恩瑞生物科技有限公司
更新日期: 2026-03-09

专利详细信息

项目 内容
专利名称 一种用于早期肝癌术后复发风险预测的方法及系统
专利类型 发明授权
申请号 CN202311779195.X
申请日 2023/12/22
公告号 CN117438097B
公开日 2024/3/15
IPC主分类号 G16H50/50
权利人 南京普恩瑞生物科技有限公司
发明人 朱燕萍; 杭雨晴; 谢剑邦; 黎旺长
地址 江苏省南京市江北新区药谷大道11号生命科技岛06栋1-2层

摘要文本

本发明公开一种用于早期肝癌术后复发风险预测的方法及系统,涉及生物基因、生物信息学及医学诊断技术领域,基于建立早期肝癌术后复发风险预测模型以及基于该模型进行预测获得风险级别分类实现;包括:通过公共数据库获取早期肝癌患者的临床数据和突变数据并进行预处理和数据过滤,获得初始建模特征;基于初始建模特征、单因素Cox比例风险模型和多因素Cox回归模型进行关键特征筛选并基于关键特征建立初级Cox比例风险模型,关键特征与生存风险相关;确定初级Cox比例风险模型为早期肝癌术后复发风险预测模型,并基于模型对复发风险进行预测。本发明充分利用了数据资源,综合考虑多种生物学特征,提高了预测的准确性。

专利主权项内容

1.一种用于早期肝癌术后复发风险预测的方法,其特征在于,所述复发风险预测基于建立早期肝癌术后复发风险预测模型以及基于所述早期肝癌术后复发风险预测模型进行预测从而获得风险级别分类实现;所述建立早期肝癌术后复发风险预测模型包括:S1,通过公共数据库获取早期肝癌患者的临床数据和突变数据并进行预处理和数据过滤,从而获得初始建模特征;S2,基于初始建模特征、单因素Cox比例风险模型和多因素Cox回归模型进行关键特征筛选并基于所述关键特征建立初级Cox比例风险模型,所述关键特征与生存风险相关;S3,确定初级Cox比例风险模型为早期肝癌术后复发风险预测模型,并基于所述早期肝癌术后复发风险预测模型对复发风险进行预测;所述S1包括:S11,通过公共数据库获取早期肝癌患者的临床数据和突变数据,并基于所述临床数据和突变数据获得符合临床筛选条件的样本;S12,对临床数据和突变数据进行预处理和数据过滤;所述S11中所述临床数据包含病理学指标和早期肝癌患者的临床特征;所述临床数据还包括与早期肝癌患者预后相关的信息,所述突变数据包括早期肝癌患者肿瘤组织中的基因突变信息;所述S12包括:(1)对于突变数据,统计每个样本的特征基因数目获得第一特征基因组;所述特征基因为突变频率大于或等于第一阈值的基因;去除第一特征基因组中的线粒体基因形成初筛特征基因组;(2)删除所述初筛特征基因组中没有特征基因的样本和特征基因的数量超过第二阈值的样本后形成初筛样本组;(3)对于所述初筛样本组中的所有样本突变数据,统计每个样本的特征基因数目获得第二特征基因组;去除第二特征基因组中的线粒体基因形成二筛特征基因组;(4)选用样本为初筛样本组,将初筛特征基因组中所有样本的建模临床信息和初筛特征基因组中的所有样本的二筛特征基因组作为初始建模特征;所述建模临床信息包括无病生存期、性别、AJCC分期、年龄和甲胎蛋白水平;所述S2包括:S21,建立单因素Cox比例风险模型,所述单因素Cox比例风险模型用于从所有初始建模特征中识别与生存风险相关的关键特征,所述单因素Cox比例风险模型的输入数据为所述初始建模特征,包括初筛样本组的建模临床信息和二筛特征基因在初筛样本组中的分布,输出数据为所述关键特征;S22,基于单因素Cox比例风险模型对所有初始建模特征分别进行单因素Cox分析,计算每个初始建模特征的C-index,选择C-index最高的初始建模特征作为起始特征;S23,构建多因素Cox回归模型,以所述起始特征为起点采用迭代的方式向多因素Cox回归模型内逐步添加一个初始建模特征并计算所述多因素Cox回归模型的C-index,确保加入的所述初始建模特征能够使得所述多因素Cox回归模型的C-index增幅最大;S24,循环执行S23,计算所述多因素Cox回归模型是否满足第一停止建模条件,当满足第一停止建模条件时形成的多因素Cox回归模型为初级Cox比例风险模型;其中,所述第一停止建模条件为多因素Cox回归模型的C-index不再增加;所述S3包括:S31,确定所述早期肝癌术后复发风险预测模型的构成,所述早期肝癌术后复发风险预测模型包括多个关键特征及对应的权重系数;S32,基于所述早期肝癌术后复发风险预测模型计算每个早期肝癌患者的风险得分,并进行生存分析;其中,所述风险得分由关键特征和其权重系数的线性组合获得;所述生存分析包括:(1)确定生存数据的最佳分割点,包括:A.合理设置最佳截断值从而将连续型自变量的风险得分转换为二分类变量;B.在二分类变量的基础上增加时间维度形成生存数据;C.通过最大选择秩统计量确定所述生存数据的最佳分割点;其中,所述最佳分割点用于根据生存数据将患者划分为高风险组患者和低风险组患者,高风险组患者表示患者术后复发风险较高,低风险组患者表示患者术后复发风险较低;(2)将生存数据转化为分类变量,拟合生存曲线并评估分类变量下的生存概率,包括:A.将计算得到的最佳分割点应用于生存数据,将连续的风险得分转化为高风险组和低风险组两组分类变量;B.根据分类后的风险得分和生存数据,绘制拟合生存曲线,生成风险曲线和风险表;C.根据所述生存曲线、风险曲线和风险表评估在高风险组和低风险组下的生存概率。。来自: