← 返回列表

基于强化学习的临床思维数据生成系统及方法

申请号: CN202410115580.2
申请人: 浙江大学
申请日期: 2024/1/29

摘要文本

本发明公开了一种基于强化学习的临床思维数据生成系统及方法,该系统包括模态标识模块、模态决策模块、大模型诊断模块、奖励反馈模块和临床思维修饰模块。本发明利用强化学习方法生成多模态医疗数据输入的临床思维数据,依据生成过程中的状态、决策和奖励,优化生成策略,训练得到最优的临床思维数据的生成策略。通过本发明中的临床思维数据生成策略,能够对临床诊断过程中产生的临床诊断数据进行思维语义空间拓展,归纳其中的临床逻辑,解决临床诊断数据中无医务人员思维过程记录的问题。同时,融合多模态数据,保证了临床可信性,增强了临床诊断数据的临床可解释性。

专利详细信息

项目 内容
专利名称 基于强化学习的临床思维数据生成系统及方法
专利类型 发明申请
申请号 CN202410115580.2
申请日 2024/1/29
公告号 CN117649949A
公开日 2024/3/5
IPC主分类号 G16H70/20
权利人 浙江大学
发明人 田雨; 李配贤; 池胜强; 李杜白; 周天舒; 李劲松
地址 浙江省杭州市西湖区余杭塘路866号

专利主权项内容

1.一种基于强化学习的临床思维数据生成系统,其特征在于,包括:模态标识模块,用于对多模态医疗数据输入进行类别标签匹配,得到若干类别标签-数据键值对,形成模态标识组;模态决策模块,将模态标识组中当前用于诊断的医疗数据输入作为状态,选择类别标签作为决策,计算选择的类别标签对应的医疗数据输入进行诊断行为的奖励,基于强化学习方法训练状态-决策表,所述状态-决策表记录当前状态做出不同决策的置信度,训练目标是根据当前状态做出决策所对应的奖励,优化状态-决策表做出决策所使用的置信度;利用状态-决策表依据模态标识组生成临床决策数据和临床决策置信度;大模型诊断模块,用于对大模型发起对话,接收模态决策模块输出的临床决策,查询其在模态标识组中对应的输入,在多轮次对话场景下请求大模型做出临床诊断,得到疾病-症状-模态三元组集合形式的临床诊断结果;奖励反馈模块,用于构建疾病-症状-模态奖励矩阵,接收大模型诊断模块输出的临床诊断结果,在疾病-症状-模态奖励矩阵中查询所有三元组对应的奖励值,计算临床诊断结果中疾病诊断结果的奖励值,得到临床决策的奖励值,返回给模态决策模块;临床思维修饰模块,用于对多模态医疗数据输入的临床决策数据进行修饰,形成能够体现临床诊断决策过程的临床思维数据。