一种医学领域中的强化学习数据构建方法及系统
摘要文本
本发明涉及医学数据构建技术领域,尤其涉及一种医学领域中的强化学习数据构建方法及系统;该方法包括:获取原始电子病例;对原始电子病例进行数据脱敏处理,得到脱敏数据集;对脱敏数据集进行实体标注和关系标注,构建状态集;构建预测集;对症状词语/症状关系词组与开源大模型答案进行人工校验,将正确的校验结果和对应的检查项价格进行标注,构建核对集;对检查项价格进行规整处理;构建强化学习数据集;基于该强化学习数据集,便于开展后续相关的强化学习,同时能够根据给定的病症或其它结果推荐价格较低的检查项目,以便为医生和患者在医学辅助诊断推荐决策中提供合适的推荐选择,降低医疗成本,提高医疗效果。 马 克 数 据 网
申请人信息
- 申请人:神州医疗科技股份有限公司
- 申请人地址:100080 北京市海淀区颐和园路2号未来科技大厦主楼12层1201室
- 发明人: 神州医疗科技股份有限公司
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种医学领域中的强化学习数据构建方法及系统 |
| 专利类型 | 发明申请 |
| 申请号 | CN202410191910.6 |
| 申请日 | 2024/2/21 |
| 公告号 | CN117764204A |
| 公开日 | 2024/3/26 |
| IPC主分类号 | G06N20/00 |
| 权利人 | 神州医疗科技股份有限公司 |
| 发明人 | 白焜太; 杨雅婷; 宋佳祥; 刘硕; 许娟; 史文钊 |
| 地址 | 北京市海淀区颐和园路2号未来科技大厦主楼12层1201室 |
专利主权项内容
1.一种医学领域中的强化学习数据构建方法,其特征在于,包括:获取患者的原始电子病例,将原始电子病例进行数据脱敏处理,得到脱敏数据集;采用人工标注技术,根据预设标签对脱敏数据集中包含的电子病例进行实体标注,得到实体词语,根据预设的标签关联关系对实体词语进行关系标注,得到关系词组;在实体词语和关系词组中,分别提取预设标签为症状的症状词语以及与症状有关的症状关系词组,构建状态集;将状态集中包含的症状词语/症状关系词组输入至开源大模型中进行提问处理,得到对应检测项的开源大模型答案,并构建预测集;采用人工校验技术,将状态集中包含的症状词语/症状关系词组与预测集中包含的开源大模型答案进行人工校验,得到开源大模型答案与对应症状词语/症状关系词组是否匹配的校验结果,并根据《检查项目及价格表》,将匹配的校验结果和对应的检查项价格进行标注,得到核对集;将核对集中包含的检查项价格进行规整处理,得到处理后的核对集;根据预设的数据格式,将状态集、预测集和处理后的核对集进行整合,构建强化学习数据集。