← 返回列表

一种用于标准数字化的知识库构建方法及系统

申请号: CN202311635195.2
申请人: 中国标准化研究院
申请日期: 2023/12/1

摘要文本

本发明公开了一种用于标准数字化的知识库构建方法及系统,包括获取标准数字化的知识数据,对所述知识数据进行预处理,根据预处理后的所述知识数据获取知识关联等级,对所述知识数据进行命名实体和实体关系提取,用于采用筛选模型对所述命名实体进行筛选获得第一实体,根据所述知识关联等级筛选所述命名实体获得第二实体,合并所述第一实体和所述第二实体获得综合实体,根据所述综合实体采用分类模型对所述知识数据进行分类获取分类数据,根据所述实体关系和所述分类数据构建知识库模型,输出知识库。该方法不仅可以提高低碳园区碳排放方法的精度,同时具有较好的可解释性,可以直接应用于低碳园区碳排放系统中。

专利详细信息

项目 内容
专利名称 一种用于标准数字化的知识库构建方法及系统
专利类型 发明申请
申请号 CN202311635195.2
申请日 2023/12/1
公告号 CN117667890A
公开日 2024/3/8
IPC主分类号 G06F16/21
权利人 中国标准化研究院
发明人 岳高峰; 高亮; 王志强; 温娜
地址 北京市海淀区知春路4号

专利主权项内容

1.一种用于标准数字化的知识库构建方法,其特征在于,包括以下步骤:获取标准数字化的知识数据,对所述知识数据进行预处理;根据预处理后的所述知识数据获取知识关联等级,对所述知识数据进行命名实体和实体关系提取;包括:计算知识数据间的相似度:其中知识数据R与知识数据C相似度为η(R, C),知识数据R与知识数据C的合集为R∪C,知识数据R与知识数据C的交集为R∩C,将相似度0.83到1知识关联等级为一级,相似度为0.51到0.82知识关联等级为二级,相似度为0.31到0.5知识关联等级为三级,相似度为0到0.3知识关联等级为四级;用于采用筛选模型对所述命名实体进行筛选获得第一实体,根据所述知识关联等级筛选所述命名实体获得第二实体;合并所述第一实体和所述第二实体获得综合实体,根据所述综合实体采用分类模型对所述知识数据进行分类获取分类数据;包括:融合第一实体和第二实体,删除重复命名实体,获取命名实体的局部密度、相对距离,计算决策值:其中命名实体e的局部密度为命名实体e的相对距离μ,命名实体e的决策值为θ,对决策值降序排序,选取前n个命名实体作为类簇中心,将小于n的前m个命名实体作为微簇中心;ee增加微簇中心的个数,获取结果影响最小的微簇中心数量;按照密度峰值聚类算法的分配策略将剩余命名实体分配给密度更大且距离更近的命名实体所在的类簇;计算命名实体间的相似度:其中命名实体e和命名实体j的相似度为F,命名实体j是命名实体e的K近邻为j∈k(e),命名实体g和命名实体e的欧式距离为c,构建命名实体间相似矩阵;ejeg计算微簇间相似度:其中微簇v和微簇v的相似度为第j个微簇中心的个数为v,微簇v到微簇v的相似度为F,微簇v到微簇v的相似度为F,根据微簇间相似度构建微簇间相似度矩阵,将相似度最高的包含类簇中心的微簇和不含最终类簇中心的微簇合并,输出综合实体;ejjejejjeje根据所述实体关系和所述分类数据构建知识库模型,输出知识库。 来源:百度马 克 数据网