← 返回列表
命名实体识别模型的训练方法、相关方法及相关产品
摘要文本
本申请公开了一种命名实体识别模型的训练方法、相关方法及相关产品。该方法包括:获取训练数据,训练数据包括训练文本、主任务的第一任务内容、第一辅助任务的第二任务内容,第一任务内容包括确定训练文本中的第一实体词语以及第一实体词语的实体类型,第二任务内容包括确定训练文本所包含的实体类型;在利用训练数据训练预训练语言模型的过程中,预训练语言模型执行主任务得到第一执行结果、执行第一辅助任务得到第二执行结果;确定第一执行结果与主任务的第一标签的第一差异;确定第二执行结果与第一辅助任务的第二标签的第二差异;基于第一差异和第二差异,更新预训练语言模型的参数,得到命名实体识别模型。
申请人信息
- 申请人:书行科技(北京)有限公司
- 申请人地址:100029 北京市朝阳区安定路5号院5号楼18层01单元
- 发明人: 书行科技(北京)有限公司
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 命名实体识别模型的训练方法、相关方法及相关产品 |
| 专利类型 | 发明申请 |
| 申请号 | CN202311666327.8 |
| 申请日 | 2023/12/6 |
| 公告号 | CN117709344A |
| 公开日 | 2024/3/15 |
| IPC主分类号 | G06F40/295 |
| 权利人 | 书行科技(北京)有限公司 |
| 发明人 | 张家晟; 刘喜凯 |
| 地址 | 北京市朝阳区安定路5号院5号楼18层01单元 |
专利主权项内容
1.一种命名实体识别模型的训练方法,其特征在于,所述方法包括:获取训练数据,所述训练数据包括训练文本、主任务指令和第一辅助任务指令,所述主任务指令包括主任务的第一任务内容,所述第一任务内容包括确定所述训练文本中的第一实体词语以及所述第一实体词语的实体类型,所述第一实体词语为命名实体,所述第一辅助任务指令包括第一辅助任务的第二任务内容,所述第二任务内容包括确定所述训练文本所包含的实体类型;在利用所述训练数据训练预训练语言模型的过程中,所述预训练语言模型依据所述主任务指令中的所述第一任务内容执行所述主任务得到第一执行结果,所述预训练语言模型依据所述第一辅助指令中的所述第二任务内容执行所述第一辅助任务得到第二执行结果;确定所述第一执行结果与所述主任务的第一标签的第一差异;确定所述第二执行结果与所述第一辅助任务的第二标签的第二差异;基于所述第一差异和所述第二差异,更新所述预训练语言模型的参数,得到命名实体识别模型,所述命名实体识别模型用于对文本进行命名实体识别。