← 返回列表

大规模数据的作者消歧方法、装置及可读存储介质

申请号: CN202410067264.2
申请人: 之江实验室
更新日期: 2026-03-20

专利详细信息

项目 内容
专利名称 大规模数据的作者消歧方法、装置及可读存储介质
专利类型 发明申请
申请号 CN202410067264.2
申请日 2024/1/17
公告号 CN117610541A
公开日 2024/2/27
IPC主分类号 G06F40/205
权利人 之江实验室
发明人 陆矜菁; 姬朋立; 严笑然; 刘洋; 顾剑波; 侯炜华
地址 浙江省杭州市余杭区中泰街道科创大道之江实验室

摘要文本

本申请涉及一种大规模数据的作者消歧方法、装置及可读存储介质,所述方法包括:基于所述大规模数据和预先定义的谓词,生成对应的谓词实例数据;其中,所述大规模数据包括结构化存储的文献信息和对应的作者信息;所述谓词实例数据包括文献作者对;将所述谓词实例数据切分为多个初始数据块;基于预先确定的一阶逻辑规则,对所述多个初始数据块中具有相同作者的文献作者对进行合并,生成最终数据块;基于所述最终数据块中的文献作者对,生成所述大规模数据对应的作者标识信息,解决了相关技术中存在的对大规模学术文献数据的作者消歧效率较低的问题。

专利主权项内容

1.一种大规模数据的作者消歧方法,其特征在于,所述方法包括:基于所述大规模数据和预先定义的谓词,生成对应的谓词实例数据;其中,所述大规模数据包括结构化存储的文献信息和对应的作者信息;所述谓词实例数据包括文献作者对;将所述谓词实例数据切分为多个初始数据块;基于预先确定的一阶逻辑规则,对所述多个初始数据块中具有相同作者的文献作者对进行合并,生成最终数据块;基于所述最终数据块中的文献作者对,生成所述大规模数据对应的作者标识信息。