一种基于关系指针网络的智能制造三元组抽取方法
申请人信息
- 申请人:南京邮电大学
- 申请人地址:210003 江苏省南京市鼓楼区新模范马路66号
- 发明人: 南京邮电大学
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种基于关系指针网络的智能制造三元组抽取方法 |
| 专利类型 | 发明申请 |
| 申请号 | CN202311726555.X |
| 申请日 | 2023/12/15 |
| 公告号 | CN117408247A |
| 公开日 | 2024/1/16 |
| IPC主分类号 | G06F40/279 |
| 权利人 | 南京邮电大学 |
| 发明人 | 亓晋; 刘晨雅; 孙雁飞; 郭宇锋; 胡筱旋; 董振江 |
| 地址 | 江苏省南京市仙林大学城文苑路9号 |
摘要文本
本发明属于智能制造三元组抽取领域,公开了一种基于关系指针网络的智能制造三元组抽取方法,包括上下文预训练模型编码模块、潜在关系预测模块、头实体解码模块、头尾实体对齐模块,以BERT预训练模型代替现行的word2vec词向量生成模型,以双向门控循环神经元为网络结构,利用平均池化网络和全连接神经网络预测出数据中存在的潜在关系,解决后续实体识别的过程中智能制造关系计算冗余的问题,再利用两个基于跨度的双层指针网络计算实体位置,解决实体嵌套与关系重叠问题,提高智能制造实体标注的准确率,最后通过关系指针网络基于潜在关系匹配实体对,从而正确抽取出智能制造三元组,提高三元组抽取任务的效率和质量。 百度搜索专利查询网
专利主权项内容
1.一种基于关系指针网络的智能制造三元组抽取方法,其特征在于:所述智能制造三元组抽取方法具体包括如下步骤:步骤1、准备文本数据,并定义所述文本数据中存在的关系集,其中,输入为一段文本句子;步骤2、采用上下文预训练模型编码模块,对步骤1中的文本数据进行编码;步骤3、利用潜在关系预测模块,预测出文本数据中候选关系集合,/>为步骤1中定义的关系集/>的子集,得到/>;步骤4、设定关系阈值,当步骤3中的/>大于/>时,视为包含三元组中的关系,将对应的关系标记为1,其余标记为0,并将该关系记入候选关系集合/>,候选关系集合/>小于关系集/>;步骤5、利用头实体解码模块,预测出头实体的起始位置与结束位置,根据头实体跨度的自然连续性确定文本中存在的头实体,输入序列中第/>个token作为头实体/>的开始与结束位置表示为/>和/>;步骤6、如果步骤5中得到的、/>的值大于预设定的阈值时,分别将其对应的token标记为1 ,视为头实体的开始或结束位置;步骤7、利用头尾实体对齐模块,遍历关系候选集中的关系,计算是否存在与头实体相关的尾实体/>,第/>个token作为尾实体开始位置的概率/>与结束位置的概率/>分别为/><<步骤8、如果步骤7中得到的值大于预设定的值时,将对应的token标记为1 ,视为尾实体的开始位置,如果/>的值大于预设定的值时,将对应的token标记为1 ,视为尾实体的结束位置,此时,匹配成功输出三元组。