论证提取以及关系识别方法、装置、设备以及存储介质
申请人信息
- 申请人:华南师范大学
- 申请人地址:528225 广东省佛山市南海区狮山南海软件园华南师范大学电子与信息工程学院
- 发明人: 华南师范大学
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 论证提取以及关系识别方法、装置、设备以及存储介质 |
| 专利类型 | 发明授权 |
| 申请号 | CN202311294228.1 |
| 申请日 | 2023/10/9 |
| 公告号 | CN117034943B |
| 公开日 | 2024/2/6 |
| IPC主分类号 | G06F40/295 |
| 权利人 | 华南师范大学 |
| 发明人 | 刘俊希; 薛云; 林逸浩; 吴承彦; 郑章楷 |
| 地址 | 广东省广州市番禺区外环西路378号华南师范大学物理与电信工程学院 |
摘要文本
华南师范大学获取“一种透气窗帘布”专利技术,本发明涉及论证处理领域,特别涉及一种论证提取以及关系识别方法、装置、设备以及存储介质,通过预设的论证挖掘模型,对待提取文本进行命题划分以及命题的词嵌入特征表示以及上下文特征表示的特征提取,基于上下文特征表示,对命题进行论证片段提取,构建若干个论证片段对,并结合命题中的若干个实体对应的实体路径信息,使得模型能更全面考虑论证片段中实体之间的联系,更加全面地对各个论证片段对进行论证关系识别,提高了论证结构信息以及论证关系信息提取的精准性以及效率性,降低了成本。
专利主权项内容
1.一种论证提取以及关系识别方法,其特征在于,包括以下步骤:获得待提取文本以及预设的论证挖掘模型,其中,所述论证挖掘模型包括命题划分模块、论证提取模块以及关系识别模块;将所述待提取文本输入至所述命题划分模块中,获得所述待提取文本的若干个命题以及所述命题对应的词嵌入特征表示以及上下文特征表示;将各个所述命题对应的上下文特征表示输入至所述论证提取模块,获得各个所述命题的论证片段,构建所述待提取文本的论证片段集,将所述论证片段集中的论证片段进行两两组合,构建若干个论证片段对,获得若干个所述论证片段对的论证片段对应的词嵌入特征表示,其中,所述论证片段包括若干个实体;获得事理图谱,所述事理图谱包括若干个事件节点,所述事件节点为事件簇,包括若干个实体;所述事理图谱包括事件节点之间连接的边关系,所述边关系用于表示连接的两个事件节点之间包含的实体是同义词或指向相同;利用事理图谱中存在有边关系的事件节点,构建若干个事件路径表示,其中,所述事件路径表示为:式中,为第个事件节点与第个事件节点连接的事件路径表示,/>为第个事件节点的概念向量,/>为第个事件节点的概念向量,概念向量为事件节点对应的概念的向量表示;ijij根据若干个所述事件路径表示,构建各个所述论证片段对的实体事件路径矩阵,其中,所述实体事件路径矩阵包括若干个所述实体与其他实体连接的事件路径表示,所述实体与其他实体连接的事件路径表示为:式中,为所述论证片段对中第个实体与第个实体连接的事件路径表示,/>为第个论证片段中第个实体的概念向量,/>为第/>个论证片段中第个实体的概念向量;ijij构建各个所述论证片段对的实体位置嵌入矩阵,将同一个所述论证片段对的实体事件路径矩阵以及实体位置嵌入矩阵进行编码处理,获得各个所述论证片段对的实体路径信息表示;将各个所述论证片段对的论证片段对应的词嵌入特征表示以及实体路径信息表示输入至所述关系识别模块中进行关系识别,获得各个所述论证片段对的论证关系识别结果。。该数据由<马克数据网>整理