← 返回列表

大语言模型训练方法、装置、设备及介质

申请号: CN202410199335.4
申请人: 北京壹永科技有限公司
申请日期: 2024/2/23

摘要文本

本发明提供了用于肿瘤疗效评价的大语言模型训练方法、装置、设备及介质。该方法包括:基于肿瘤疗效评价以及用于肿瘤疗效评价的多个医学判断维度生成多个任务,多个任务包括以肿瘤疗效评价为任务目标的疗效评价任务、以多个医学判断维度分别为任务目标的多个维度判断任务和以肿瘤疗效评价和多个医学判断维度中的两个或更多个共同为任务目标的共享任务;将医疗文本数据分别输入多个维度判断任务及共享任务以获得维度判断任务梯度、维度判断任务结果、共享任务梯度及共享任务结果;将医疗文本数据、维度判断任务结果及共享任务结果输入疗效评价任务以获得疗效评价任务的疗效评价任务梯度;以及基于多个任务各自的任务梯度来更新大语言模型的参数。

专利详细信息

项目 内容
专利名称 大语言模型训练方法、装置、设备及介质
专利类型 发明申请
申请号 CN202410199335.4
申请日 2024/2/23
公告号 CN117786536A
公开日 2024/3/29
IPC主分类号 G06F18/2415
权利人 北京壹永科技有限公司
发明人 张程剀; 刘泽恩; 刘晓华; 陈小梅
地址 北京市朝阳区广顺北大街33号院1号楼5层1单元601室

专利主权项内容

1.一种用于肿瘤疗效评价的大语言模型训练方法,包括:基于肿瘤疗效评价以及用于所述肿瘤疗效评价的多个医学判断维度生成多个任务,其中所述多个任务包括以肿瘤疗效评价作为任务目标的疗效评价任务、以多个医学判断维度分别作为任务目标的多个维度判断任务、以及以肿瘤疗效评价和多个医学判断维度中的两个或更多个共同作为任务目标的共享任务;将医疗文本数据分别输入所述多个维度判断任务以获得对应于所述多个维度判断任务的多个维度判断任务梯度以及多个维度判断任务结果;将所述医疗文本数据输入所述共享任务以获得所述共享任务的共享任务梯度以及共享任务结果;响应于获得所述多个维度判断任务结果以及所述共享任务结果,将所述医疗文本数据、所述多个维度判断任务结果以及所述共享任务结果输入所述疗效评价任务以获得所述疗效评价任务的疗效评价任务梯度;以及基于所述多个任务各自的任务梯度来更新所述大语言模型的参数。