一种基于机器学习模型的骨肉瘤生存预测方法
摘要文本
本发明涉及一种基于机器学习模型的骨肉瘤生存预测方法,其方法包括:基于SEER数据库得到数据基线资料;从基线资料中运用多种方法筛选出初筛变量作为可选因子组合;基于可选因子组合来构建多种机器学习组合预测模型,并根据平均C‑index值确定最优预测模型;根据最优预测模型对可选因子组合进行变量筛选和重要性评价,得到最优变量组合,引入risk score结合最优变量组合临床指标进行包含KM生存曲线、单因素Cox、多因素Cox和建立列线图预测几年生存率的生存分析。本发明解决了现有的临床特征难以评估骨肉瘤患者的真实情况的问题,能给骨肉瘤患者提供合适的高精度的能够纳入多种预后相关的变化因素的预测模型。
申请人信息
- 申请人:中国人民解放军总医院
- 申请人地址:100039 北京市海淀区复兴路28号
- 发明人: 中国人民解放军总医院
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种基于机器学习模型的骨肉瘤生存预测方法 |
| 专利类型 | 发明申请 |
| 申请号 | CN202311693891.9 |
| 申请日 | 2023/12/11 |
| 公告号 | CN117672522A |
| 公开日 | 2024/3/8 |
| IPC主分类号 | G16H50/30 |
| 权利人 | 中国人民解放军总医院 |
| 发明人 | 尹成亮; 何昆仑; 乌日力格; 孙晓春; 陈媛媛; 王万玲; 许嘉宇 |
| 地址 | 北京市海淀区复兴路28号 |
专利主权项内容
1.一种基于机器学习模型的骨肉瘤生存预测方法,其特征在于,包括:对获取的SEER数据库中的骨肉瘤患者的资料数据进行数据筛选、数据填补以及连续变量离散,得到包含多个变量的数据基线资料;通过单因素Cox回归分析、全子集回归分析和LASSO回归与交叉验证分析之中至少一种方式从数据基线资料中筛选出至少一组初筛变量;将至少一组初筛变量输入多因素Cox模型进行再次筛选,以最小AIC值确定其中一组初筛变量作为可选因子组合;基于可选因子组合来构建多种机器学习组合预测模型,并根据计算得到的每个预测模型的平均C-index值确定最优预测模型;根据最优预测模型对可选因子组合进行变量筛选和重要性评价,得到最优变量组合,引入一个作为新的Signature的风险评估项risk score对最优变量组合中的变量组合进行包含Kaplan-Meier生存曲线分析、单因素Cox分析、多因素Cox分析和建立列线图N年期生存率预测分析的生存分析;其中,最优变量组合中的变量均为与预后相关的独立的变量,包括作为保护因素的手术变量和作为危险变量的年龄、肿瘤分级、肿瘤大小、M分期和肺转移变量。