← 返回列表

命名实体识别模型建立方法及命名实体识别方法

申请号: CN202110939636.2
申请人: 北京中科凡语科技有限公司
更新日期: 2026-03-09

专利详细信息

项目 内容
专利名称 命名实体识别模型建立方法及命名实体识别方法
专利类型 发明申请
申请号 CN202110939636.2
申请日 2020/11/20
公告号 CN113807097A8
公开日 2024/1/16
IPC主分类号 G06F40/295
权利人 北京中科凡语科技有限公司
发明人 周玉
地址 北京市海淀区知春路63号51号楼10层1006

摘要文本

北京中科凡语科技有限公司获取“一种透气窗帘布”专利技术,本公开提供一种命名实体识别模型建立方法,其包括:获取目标领域的训练文本集;基于目标领域的领域特征构建命名实体种类集以及文本段落类别集;基于文本段落类别集以及命名实体种类集构建“文本段落类别-命名实体种类”映射字典;使用“文本段落类别-命名实体种类”映射字典对训练文本集中的所有训练文本进行标注,获得每个训练文本的标注序列集,对每个训练文本的标注序列集进行修正,获得修正后的标注序列集;以及至少基于训练文本集的所有训练文本的修正后的标注序列集进行命名实体识别模型训练,获得命名实体识别模型。本公开还提供一种命名实体识别方法、实体识别模型建立装置、命名实体识别装置、电子设备及存储介质。

专利主权项内容

1.一种命名实体识别模型建立方法,其特征在于,包括:S1、获取目标领域的训练文本集;S2、基于所述目标领域的领域特征构建命名实体种类集以及文本段落类别集;S3、基于所述文本段落类别集以及所述命名实体种类集构建“文本段落类别-命名实体种类”映射字典;S4、使用所述“文本段落类别-命名实体种类”映射字典对所述训练文本集中的所有训练文本进行标注,获得每个训练文本的标注序列集,对每个训练文本的标注序列集进行修正,获得修正后的标注序列集;以及S5、至少基于所述训练文本集的所有训练文本的修正后的标注序列集进行命名实体识别模型训练,获得命名实体识别模型。