垂直领域大语言模型的训练方法及装置、存储介质、设备
摘要文本
本申请公开了一种垂直领域大语言模型的训练方法及装置、存储介质、计算机设备,该方法包括:获取基于通用领域的初始大模型以及初始大模型对应的多个第一训练样本集,各第一训练样本集中训练样本的语料配比各不相同;利用各第一训练样本集分别对初始大模型进行训练,得到各第一测试大模型,并通过第一测试样本集分别对各第一测试大模型进行测试,确定第一测试大模型中的第一被选大模型;将训练第一被选大模型所使用的第一训练样本集的语料配比作为目标语料配比,按目标语料配比构建目标训练样本集,并利用目标训练样本集对初始大模型或第一被选大模型进行训练,得到目标大模型在通用领域和目标应用领域都具有较好知识问答能力的大模型。
申请人信息
- 申请人:浙江口碑网络技术有限公司; 拉扎斯网络科技(上海)有限公司
- 申请人地址:310056 浙江省杭州市滨江区长河街道网商路699号5号楼2楼203室
- 发明人: 浙江口碑网络技术有限公司; 拉扎斯网络科技(上海)有限公司
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 垂直领域大语言模型的训练方法及装置、存储介质、设备 |
| 专利类型 | 发明授权 |
| 申请号 | CN202311694892.5 |
| 申请日 | 2023/12/12 |
| 公告号 | CN117390142B |
| 公开日 | 2024/3/12 |
| IPC主分类号 | G06F16/33 |
| 权利人 | 浙江口碑网络技术有限公司; 拉扎斯网络科技(上海)有限公司 |
| 发明人 | 方之家; 苑爱泉; 张忠敏; 穆瑞斌; 胡盼盼; 王晓伟; 雷蕾; 吴焜 |
| 地址 | 浙江省杭州市滨江区长河街道网商路699号5号楼2楼203室; 上海市普陀区真北路788号507室 |
专利主权项内容
1.一种垂直领域大语言模型的训练方法,其特征在于,所述方法包括:获取基于通用领域的初始大语言模型、以及所述初始大语言模型对应的多个第一训练样本集,其中,各第一训练样本集中训练样本的语料配比各不相同,所述语料配比为目标应用领域语料样本和通用领域语料样本之间的数量比例;基于不同领域语料样本按对应的语料配比交替的顺序分别确定各第一训练样本集的语料样本训练顺序,利用各第一训练样本集分别对所述初始大语言模型进行训练,得到各第一训练样本集各自对应的第一测试大语言模型,并通过第一测试样本集分别对各第一测试大语言模型进行测试,根据得到的第一测试结果确定所述第一测试大语言模型中的第一被选大语言模型,其中,所述第一测试样本集包括通用领域测试样本和目标应用领域测试样本;将训练所述第一被选大语言模型所使用的第一训练样本集的语料配比作为目标语料配比,按所述目标语料配比构建目标训练样本集,并基于不同领域语料样本按目标语料配比交替的顺序确定所述目标训练样本集的语料样本训练顺序,利用所述目标训练样本集对所述初始大语言模型或所述第一被选大语言模型进行第一轮训练,利用包含多种知识问答类型的测试样本对训练得到目标大语言模型进行测试,基于测试结果对训练样本的内容种类比例进行调优,按调优后的内容种类比例和所述目标语料配比构建下一轮训练样本集进行下一轮训练,对目标大语言模型进行多轮训练直到满足训练结束条件为止,其中,所述目标大语言模型用于通用领域和目标应用领域下的知识问答,各知识问答类型与各语料样本内容种类之间具有对应关系。