← 返回列表

知识领域的知识图谱构建方法

申请号: CN202311463001.5
申请人: 南京题谱思信息科技有限公司
更新日期: 2026-03-09

专利详细信息

项目 内容
专利名称 知识领域的知识图谱构建方法
专利类型 发明申请
申请号 CN202311463001.5
申请日 2023/11/6
公告号 CN117390201A
公开日 2024/1/12
IPC主分类号 G06F16/36
权利人 南京题谱思信息科技有限公司
发明人 徐陈
地址 江苏省南京市江宁开发区秣陵街道佛城路8号美丽新世界金德茂花园25-102

摘要文本

本发明一种知识领域的知识图谱构建方法,属于知识图谱构建技术领域。本发明包括以下步骤,确定构建知识图谱的知识领域,提取知识领域内的所有实体并进行素数索引,将知识领域内公认的定理、推论、性质、公理、法则或公式全部提取出来作为关系知识,并对关系知识进行实体提取和素数索引;将关系知识和关系知识包含的实体一起作为知识图谱的节点,通过节点与节点之间是否有相同实体来进行节点的连接形成知识图谱。本发明在对某一知识领域进行知识图谱的构建过程中采用了关系节点作为知识图谱的一个个节点,用关系节点和关系节点之间是否有相同的知识实体作为两个关系节点是否连接的判断,使得整个知识图谱的节点大大缩小,不会过于臃肿。

专利主权项内容

1.一种知识领域的知识图谱构建方法,其特征在于:包括以下步骤:步骤1:确定需要构建知识图谱的知识领域,并通过中文命名的实体识别方法将所述知识领域内的全部知识实体提取出来形成知识实体集合A,如下式(1)所示,A={A、A、...、An} (1),12式(1)中,A是所述知识领域所提取的第一个知识实体,A是所述知识领域所提取的第二个知识实体,A所述知识领域所提取的最后一个知识实体;12n将所述知识实体集合A中的所有实体按照提取顺序采用不同的素数p进行素数索引,形成素数索引知识实体集合A,如下式(2)所示,p式(2)中,是经过素数p进行索引的所述知识领域所提取的第一个知识实体,/>是经过素数p进行索引的所述知识领域所提取的第二个知识实体,/>是经过素数p进行索引的所述知识领域所提取的最后一个知识实体;12n步骤2:将所述知识领域内公认的定理、推论、性质、公理、法则或公式全部提取出来作为关系知识形成关系知识集合B,如下式(3)所示,B={B、B、...、Bm} (3),12式(3)中,B是所述知识领域所提取的第一个关系知识,B是所述知识领域所提取的第二个关系,B所述知识领域所提取的最后一个关系知识;12m通过Jieba分词器对所述关系知识集合B中的第一个关系知识进行实体划分并将划分后的结果收集起来形成第一个关系知识实体集合如下式(4)所示,式(4)中,a、a、...、a均是大于等于1同时小于等于n的自然数,且a≠a≠...≠a;12q12q然后将所述关系知识集合B中剩余的所有关系知识依次进行实体划分并将划分后的结果依次收集起来形成对应的关系知识实体集合,将所有的关系知识实体集合收集起来形成关系知识实体集合矩阵B,如下式(5)所示,A式(5)中,b、b、...、b均是大于等于1同时小于等于n的自然数,且b≠b≠...≠b;n、n、...、n均是大于等于1同时小于等于n的自然数,且n≠n≠...≠n;12q12q12q12q步骤3:将关系知识集合B中的第一关系知识B和所述第一关系知识实体集合中的所有关系知识实体提取出来形成构建所述知识领域知识图谱的第一关系节点C,然后按照第一关系节点C的构建方法依次将所述将关系知识集合B中剩余的关系知识所对应的关系节点构建出来,并将所有的关系节点收集起来形成关系节点矩阵C,如下式(6)所示,111式(6)中,C是所述第二关系知识B和所述第二关系知识实体集合中的所有关系知识实体提取出来形成构建所述知识领域知识图谱的第二关系节点;C是所述最后一个关系知识B和所述最后关系知识实体集合/>中的所有关系知识实体提取出来形成构建所述知识领域知识图谱的最后一个关系节点;>>>>依次将所有的所述关系节点所包含的所有关系知识实体上的素数索引相乘形成所述关系节点的标记,并将标记后的所有标记关系节点收集起来形成标记关系节点矩阵C,如下式(6)所示,>式(6)中,是带有标记的第一标记关系节点;q是所述C的标记且是所述C中所有关系知识实体的素数索引相乘的结果;/>是带有标记的第二标记关系节点;q是所述C的标记且是所述C中所有关系知识实体的素数索引相乘的结果;/>是带有标记的最后一个标记关系节点;q是所述C的标记且是所述C中所有关系知识实体的素数索引相乘的结果;>>>222nnn步骤4:将所述关系节点矩阵C中所有标记关系节点依次两两进行连接判断,看进行判断的两个标记关系节点各自所包含的关系知识实体集合之间是否有交集,若有交集,则将两个标记关系节点连接起来;若无交集,则说明两个标记节点之间并无联系不用连接;当所述关系节点矩阵C中所有标记关系节点均依次两两进行连接判断后,所述知识领域的知识图谱构建完成。qq