← 返回列表
一种文本生成模型的训练方法、装置、介质及电子设备
申请人信息
- 申请人:之江实验室
- 申请人地址:311121 浙江省杭州市余杭区中泰街道科创大道之江实验室
- 发明人: 之江实验室
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种文本生成模型的训练方法、装置、介质及电子设备 |
| 专利类型 | 发明申请 |
| 申请号 | CN202410236982.8 |
| 申请日 | 2024/3/1 |
| 公告号 | CN117807961A |
| 公开日 | 2024/4/2 |
| IPC主分类号 | G06F40/166 |
| 权利人 | 之江实验室 |
| 发明人 | 蔡京京; 董波; 柏洁明; 葛俊; 孔祥夫; 周宏豪 |
| 地址 | 浙江省杭州市余杭区中泰街道科创大道之江实验室 |
摘要文本
本说明书公开了一种文本生成模型的训练方法、装置、介质及电子设备,包括:确定收集到的公文,针对公文包括的每个标题,确定在公文中该标题的上级标题。根据上级标题,确定该标题的提示文本,有助于文本生成模型在生成该标题下的内容时可以受到该标题的上级标题的影响。然后,将提示文本和该标题输入预先训练的初始文本生成模型,确定输出文本。确定在公文中该标题对应的文本,并作为目标文本。根据目标文本和输出文本,对初始文本生成模型进行训练,得到文本生成模型,提高文本生成模型生成的文本的准确性。
专利主权项内容
1.一种文本生成模型的训练方法,其特征在于,包括:确定收集到的公文,其中,所述公文包括若干标题;针对所述公文包括的每个标题,确定在所述公文中该标题的上级标题;根据所述上级标题,确定该标题的提示文本;将所述提示文本和该标题输入预先训练的初始文本生成模型,确定输出文本;其中,所述初始文本生成模型为大语言模型;确定在所述公文中该标题对应的文本,并作为目标文本;根据所述目标文本和所述输出文本,对所述初始文本生成模型进行训练,得到文本生成模型;其中,所述文本生成模型用于根据用户输入的文本,生成所述用户所需的公文。