垂直领域大语言模型的训练方法及装置、存储介质、设备

申请号: CN202311694892.5

申请人: 浙江口碑网络技术有限公司; 拉扎斯网络科技(上海)有限公司

申请日期: 2023/12/12

摘要文本

本申请公开了一种垂直领域大语言模型的训练方法及装置、存储介质、计算机设备，该方法包括：获取基于通用领域的初始大模型以及初始大模型对应的多个第一训练样本集，各第一训练样本集中训练样本的语料配比各不相同；利用各第一训练样本集分别对初始大模型进行训练，得到各第一测试大模型，并通过第一测试样本集分别对各第一测试大模型进行测试，确定第一测试大模型中的第一被选大模型；将训练第一被选大模型所使用的第一训练样本集的语料配比作为目标语料配比，按目标语料配比构建目标训练样本集，并利用目标训练样本集对初始大模型或第一被选大模型进行训练，得到目标大模型在通用领域和目标应用领域都具有较好知识问答能力的大模型。

申请人信息

申请人:浙江口碑网络技术有限公司; 拉扎斯网络科技(上海)有限公司
申请人地址:310056 浙江省杭州市滨江区长河街道网商路699号5号楼2楼203室
发明人: 浙江口碑网络技术有限公司; 拉扎斯网络科技(上海)有限公司

专利详细信息

项目	内容
专利名称	垂直领域大语言模型的训练方法及装置、存储介质、设备
专利类型	发明授权
申请号	CN202311694892.5
申请日	2023/12/12
公告号	CN117390142B
公开日	2024/3/12
IPC主分类号	G06F16/33
权利人	浙江口碑网络技术有限公司; 拉扎斯网络科技(上海)有限公司
发明人	方之家; 苑爱泉; 张忠敏; 穆瑞斌; 胡盼盼; 王晓伟; 雷蕾; 吴焜
地址	浙江省杭州市滨江区长河街道网商路699号5号楼2楼203室; 上海市普陀区真北路788号507室

专利主权项内容

1.一种垂直领域大语言模型的训练方法，其特征在于，所述方法包括：获取基于通用领域的初始大语言模型、以及所述初始大语言模型对应的多个第一训练样本集，其中，各第一训练样本集中训练样本的语料配比各不相同，所述语料配比为目标应用领域语料样本和通用领域语料样本之间的数量比例；基于不同领域语料样本按对应的语料配比交替的顺序分别确定各第一训练样本集的语料样本训练顺序，利用各第一训练样本集分别对所述初始大语言模型进行训练，得到各第一训练样本集各自对应的第一测试大语言模型，并通过第一测试样本集分别对各第一测试大语言模型进行测试，根据得到的第一测试结果确定所述第一测试大语言模型中的第一被选大语言模型，其中，所述第一测试样本集包括通用领域测试样本和目标应用领域测试样本；将训练所述第一被选大语言模型所使用的第一训练样本集的语料配比作为目标语料配比，按所述目标语料配比构建目标训练样本集，并基于不同领域语料样本按目标语料配比交替的顺序确定所述目标训练样本集的语料样本训练顺序，利用所述目标训练样本集对所述初始大语言模型或所述第一被选大语言模型进行第一轮训练，利用包含多种知识问答类型的测试样本对训练得到目标大语言模型进行测试，基于测试结果对训练样本的内容种类比例进行调优，按调优后的内容种类比例和所述目标语料配比构建下一轮训练样本集进行下一轮训练，对目标大语言模型进行多轮训练直到满足训练结束条件为止，其中，所述目标大语言模型用于通用领域和目标应用领域下的知识问答，各知识问答类型与各语料样本内容种类之间具有对应关系。

垂直领域大语言模型的训练方法及装置、存储介质、设备

摘要文本

申请人信息

专利详细信息

专利主权项内容

热门技术领域

快速入口

专利技术资料

垂直领域大语言模型的训练方法及装置、存储介质、设备

摘要文本

申请人信息

专利详细信息

专利主权项内容

相关专利推荐

一种耐磨损塑料模具钢及其制备方法

基于数字化控制的纺织印染废水的节能处理工艺

基于数字化控制的涤纶布料的节水印染系统

一种智能球头、应用方法及车辆

一种碳纤维氧化炉送风与回风分配装置

一种建筑整体保温性能检测主体及其检测方法

热门技术领域

快速入口

专利技术资料