← 返回列表

融合知识图谱与大语言模型的文献复杂知识对象抽取方法

申请号: CN202311551341.3
申请人: 中国科学院成都文献情报中心
申请日期: 2023/11/20

摘要文本

本发明公开了一种融合知识图谱与大语言模型的文献复杂知识对象抽取方法,属于数据挖掘领域,包括步骤:S1,领域知识图谱构建;S2,大语言模型微调;S3,复杂知识对象抽取:利用知识图谱来构建提示prompt,通过步骤S1中模式层将挖掘任务转换为多轮问答问题,在每一轮问答中获取实例层中的三元组来构建最优提示prompt,通过不同长度的问题链来实现细粒度的领域知识对象挖掘。本发明可以从海量的多源异构文献数据中高效、可信地进行知识对象的自动化抽取、结构化组织、语义化关联与知识化存储。。(来 自 专利查询网)

专利详细信息

项目 内容
专利名称 融合知识图谱与大语言模型的文献复杂知识对象抽取方法
专利类型 发明申请
申请号 CN202311551341.3
申请日 2023/11/20
公告号 CN117725222A
公开日 2024/3/19
IPC主分类号 G06F16/36
权利人 中国科学院成都文献情报中心
发明人 陈文杰; 胡正银; 卢颖; 石栖
地址 四川省成都市天府新区群贤南街289号

专利主权项内容

1.一种融合知识图谱与大语言模型的文献复杂知识对象抽取方法,其特征在于,包括以下步骤:S1,领域知识图谱构建:设计学科领域本体完成知识图谱模式层构建,通过标注工具进行命名实体识别和关系抽取,将标注结果以三元组的形式导入图数据库实现知识存储与图谱实例层构建;S2,大语言模型微调:本地化部署大语言模型,利用知识图谱实例层构建微调数据集;S3,复杂知识对象抽取:利用知识图谱来构建提示prompt,通过步骤S1中模式层将挖掘任务转换为多轮问答问题,在每一轮问答中获取实例层中的三元组来构建最优提示prompt,通过不同长度的问题链来实现细粒度的领域知识对象挖掘。