一种获取核心事件的数据处理系统
摘要文本
本发明涉及一种获取核心事件的数据处理系统,涉及文本处理技术领域,包括处理器和存储有计算机程序的存储器,当计算机程序被处理器执行时,实现以下步骤:获取目标文本对应的初始事件列表,获取目标事件关系图,获取候选事件列表,获取第一候选事件列表和第二候选事件列表,根据目标事件关系图和第二候选事件列表,获取第二候选事件列表对应的候选优先级列表,根据第一候选事件列表和候选优先级列表,获取核心事件列表,本发明遍历了文本中的全部事件,根据事件以及事件包括的特征信息构建事件关系图,通过图能够更加直观的获取到事件的特征信息,将图的特征信息与文本的特征信息相结合筛选核心事件,提高了获取到核心事件的准确性。
申请人信息
- 申请人:中科雨辰科技有限公司
- 申请人地址:100093 北京市海淀区清琴麓苑170号楼2层
- 发明人: 中科雨辰科技有限公司
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种获取核心事件的数据处理系统 |
| 专利类型 | 发明授权 |
| 申请号 | CN202311765606.X |
| 申请日 | 2023/12/21 |
| 公告号 | CN117435697B |
| 公开日 | 2024/3/22 |
| IPC主分类号 | G06F16/33 |
| 权利人 | 中科雨辰科技有限公司 |
| 发明人 | 张正义; 林方; 傅晓航; 朱杰 |
| 地址 | 北京市海淀区清琴麓苑170号楼2层 |
专利主权项内容
1.一种获取核心事件的数据处理系统,其特征在于,所述系统包括:处理器和存储有计算机程序的存储器,当所述计算机程序被处理器执行时,实现以下步骤:S100,根据目标文本,获取目标文本对应的初始事件列表,其中,所述初始事件列表包括若干个初始事件,所述初始事件为从目标文本中获取到的事件,所述目标文本为待获取核心事件的文本;S200,根据初始事件列表,获取目标事件关系图,其中,所述目标事件关系图包括初始事件列表中的每个初始事件、每个初始事件对应的若干个论元、每个初始事件与其包括的每个论元的连接关系、相关联的初始事件之间的连接关系;S300,根据目标事件关系图,获取候选事件列表,其中,所述候选事件列表包括若干个候选事件,所述候选事件为基于目标事件关系图获取到的与初始事件相连接的论元中包括时间论元的初始事件;S400,根据候选事件列表,获取第一候选事件列表和第二候选事件列表A={A,……,A,……,A},A为第i个第二候选事件,i=1……n,n为第二候选事件的数量,其中,所述第一候选事件列表包括若干个第一候选事件,所述第一候选事件为从候选事件列表中获取到的与目标文本标题相关或与目标文本首句相关的候选事件,所述第二候选事件为候选事件列表中除第一候选事件之外的任一候选事件,其中,在S400中通过如下步骤获取第一候选事件:1iniS401,获取目标文本对应的指定文本向量,其中,所述指定文本向量为指定文本的向量,所述指定文本为目标文本对应的标题;S403,根据指定文本向量,获取指定相似度列表G={G,……,G,……,G},G为第r个候选事件向量与指定文本向量之间的相似度,r=1……s,s为指定相似度的数量,所述候选事件向量为基于自然语言处理模型获取到的候选事件对应的向量;1rsrS405,当G≥G时,获取G对应的候选事件为第一候选事件,其中,G为预设的相似度阈值;r0r0S407,根据G,获取待定事件列表,所述待定事件列表包括若干个待定事件,其中,当G<G时,获取G对应的候选事件为待定事件;r0rS409,根据待定事件列表,获取第一候选事件,其中,当待定事件所在语句为目标文本对应的首句时,获取待定事件为第一候选事件;S500,根据目标事件关系图和A,获取A对应的候选优先级列表B={B,……,B,……,B},B为A对应的候选优先级,其中,所述候选优先级为基于目标事件关系图中与第二候选事件相连接的初始事件和论元获取到的第二候选事件对应的权重;1iniiS600,根据第一候选事件列表和B,获取核心事件列表,其中,所述核心事件列表包括第一候选事件列表中的第一候选事件,且当B≥B时,将B对应的第二候选事件插入至核心事件列表中,B为预设的优先级阈值。i0i0