大语言模型训练方法、装置、设备及介质

申请号: CN202410199335.4

申请人: 北京壹永科技有限公司

申请日期: 2024/2/23

摘要文本

本发明提供了用于肿瘤疗效评价的大语言模型训练方法、装置、设备及介质。该方法包括：基于肿瘤疗效评价以及用于肿瘤疗效评价的多个医学判断维度生成多个任务，多个任务包括以肿瘤疗效评价为任务目标的疗效评价任务、以多个医学判断维度分别为任务目标的多个维度判断任务和以肿瘤疗效评价和多个医学判断维度中的两个或更多个共同为任务目标的共享任务；将医疗文本数据分别输入多个维度判断任务及共享任务以获得维度判断任务梯度、维度判断任务结果、共享任务梯度及共享任务结果；将医疗文本数据、维度判断任务结果及共享任务结果输入疗效评价任务以获得疗效评价任务的疗效评价任务梯度；以及基于多个任务各自的任务梯度来更新大语言模型的参数。

申请人信息

申请人:北京壹永科技有限公司
申请人地址:100102 北京市朝阳区广顺北大街33号院1号楼5层1单元601室
发明人: 北京壹永科技有限公司

专利详细信息

项目	内容
专利名称	大语言模型训练方法、装置、设备及介质
专利类型	发明申请
申请号	CN202410199335.4
申请日	2024/2/23
公告号	CN117786536A
公开日	2024/3/29
IPC主分类号	G06F18/2415
权利人	北京壹永科技有限公司
发明人	张程剀; 刘泽恩; 刘晓华; 陈小梅
地址	北京市朝阳区广顺北大街33号院1号楼5层1单元601室

专利主权项内容

1.一种用于肿瘤疗效评价的大语言模型训练方法，包括：基于肿瘤疗效评价以及用于所述肿瘤疗效评价的多个医学判断维度生成多个任务，其中所述多个任务包括以肿瘤疗效评价作为任务目标的疗效评价任务、以多个医学判断维度分别作为任务目标的多个维度判断任务、以及以肿瘤疗效评价和多个医学判断维度中的两个或更多个共同作为任务目标的共享任务；将医疗文本数据分别输入所述多个维度判断任务以获得对应于所述多个维度判断任务的多个维度判断任务梯度以及多个维度判断任务结果；将所述医疗文本数据输入所述共享任务以获得所述共享任务的共享任务梯度以及共享任务结果；响应于获得所述多个维度判断任务结果以及所述共享任务结果，将所述医疗文本数据、所述多个维度判断任务结果以及所述共享任务结果输入所述疗效评价任务以获得所述疗效评价任务的疗效评价任务梯度；以及基于所述多个任务各自的任务梯度来更新所述大语言模型的参数。

大语言模型训练方法、装置、设备及介质

摘要文本

申请人信息

专利详细信息

专利主权项内容

热门技术领域

快速入口

专利技术资料

大语言模型训练方法、装置、设备及介质

摘要文本

申请人信息

专利详细信息

专利主权项内容

相关专利推荐

一种全光产品的质量检测方法及系统

一种3D打印机脱料装置

一种基于试验数据库的压气机性能仿真程序精度评估方法

一种基于灰盒模型的节流阀响应预测方法

一种用于水性工业漆的加工装置

双辐板涡轮盘

热门技术领域

快速入口

专利技术资料