实体链接方法、装置、存储介质及电子设备
摘要文本
本公开涉及一种实体链接方法、实体链接装置、计算机可读存储介质及电子设备,实体链接方法包括:从医疗文本中提取待链接实体;在标准词条数据库中筛选得到与所述待链接实体具有匹配特征的标准词条的候选集合;通过预设模型为所述候选集合中的各个标准词条提供语义相关性评分;将所述待链接实体链接至所述候选集合中的语义相关性评分最高的标准词条。本公开通过对临床中具有不同表达方式的医学术语进行语义识别以将待链接实体链接至最接近的标准词条,提高了实体链接方法的效率和准确率。
申请人信息
- 申请人:天津新开心生活科技有限公司; 天津开心生活科技有限公司
- 申请人地址:300467 天津市滨海新区天津生态城国家动漫园文三路105号读者大厦第三层办公室A区311
- 发明人: 天津新开心生活科技有限公司; 天津开心生活科技有限公司
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 实体链接方法、装置、存储介质及电子设备 |
| 专利类型 | 发明授权 |
| 申请号 | CN201811330154.1 |
| 申请日 | 2018年11月9日 |
| 公告号 | CN109522551B |
| 公开日 | 2024年2月20日 |
| IPC主分类号 | G06F40/289 |
| 权利人 | 天津新开心生活科技有限公司; 天津开心生活科技有限公司 |
| 发明人 | 刘旭; 刘学梁; 王琛; 季思伟 |
| 地址 | 天津市滨海新区天津生态城国家动漫园文三路105号读者大厦第三层办公室A区311; 天津市宝坻区节能环保工业区海关大厦220-41 |
专利主权项内容
1.一种实体链接方法,其特征在于,包括:从医疗文本中提取待链接实体;在标准词条数据库中筛选得到与所述待链接实体具有匹配特征的标准词条的候选集合;在所述标准词条的候选集合中通过语义分析滤除与所述待链接实体语义不符的标准词条,包括:对所述待链接实体进行语义角色标注,得到核心语义特征,利用知识图谱对所述核心语义特征的兼容性进行语义检查,所述兼容性包括所述核心语义特征之间的关系和打分;通过预设模型为所述候选集合中的各个标准词条提供语义相关性评分;所述预设模型用于计算所述待链接实体与所述标准词条之间的语义相关程度;根据所述相关性评分的高低对所述候选集合中的各个标准词条排序;将所述待链接实体链接至所述候选集合中的语义相关性评分最高的标准词条;建立一用于计算语义置信度的判别模型,将所述候选集合中的所述语义相关性评分最高的标准词条输入至所述判别模型中进行语义完整性检查,如果检查结果不能满足指定的先验条件,则在所述候选集合中删除所述标准词条,将待链接实体链接至原候选集合中评分第二高的标准词条;而如果所述评分第二高的标准词条也不能通过所述语义置信度的判别模型,则将待链接实体链接至原候选集合中评分第三高的标准词条,以此类推直至获得准确的链接结果。