基于知识图谱和大语言模型的关系抽取方法、系统及介质
申请人信息
- 申请人:哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
- 申请人地址:518000 广东省深圳市南山区桃源街道深圳大学城哈尔滨工业大学校区
- 发明人: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 基于知识图谱和大语言模型的关系抽取方法、系统及介质 |
| 专利类型 | 发明授权 |
| 申请号 | CN202311830157.2 |
| 申请日 | 2023/12/28 |
| 公告号 | CN117494806B |
| 公开日 | 2024/3/8 |
| IPC主分类号 | G06N5/022 |
| 权利人 | 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) |
| 发明人 | 李晶; 马熙来; 张民 |
| 地址 | 广东省深圳市南山区桃源街道深圳大学城哈尔滨工业大学校区 |
摘要文本
哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)取得“一种透气窗帘布”专利技术,本发明公开了一种基于知识图谱和大语言模型的关系抽取方法、系统及介质,涉及自然语言处理技术领域,包括:从知识图谱中提取出待预测文本中的目标实体对应的候选抽象实体;目标实体包括头实体和尾实体;基于大语言模型和依据目标实体所在文本,将候选抽象实体与实际语境中对应的抽象实体进行关联,得到目标实体对应的关联抽象实体和对关联抽象实体的推理过程;将推理过程融入提示中,利用大语言模型生成待预测文本中的头实体和尾实体之间的目标预测关系。本发明缓解了现有技术存在的对模型进行训练的过程费时费力的技术问题。
专利主权项内容
1.一种基于知识图谱和大语言模型的关系抽取方法,其特征在于,所述方法包括:从知识图谱中提取出待预测文本中的目标实体对应的候选抽象实体;所述目标实体包括头实体和尾实体;基于大语言模型和依据所述目标实体所在文本,将所述候选抽象实体与实际语境中对应的抽象实体进行关联,得到所述目标实体对应的关联抽象实体和对所述关联抽象实体的推理过程;将所述推理过程融入提示中,利用大语言模型生成所述待预测文本中的头实体和尾实体之间的目标预测关系;其中,基于大语言模型和依据所述目标实体所在文本,将所述候选抽象实体与实际语境中对应的抽象实体进行关联,得到所述目标实体对应的关联抽象实体和对所述关联抽象实体的推理过程,包括:将所述候选抽象实体和所述待预测文本一起输入到大语言模型中,提示大语言模型给出所述目标实体最契合当前文本的关联抽象实体;其中,所述大语言模型的推理样例为人工标注的种子样例,所述推理样例的样本数为至少一个;基于所述大语言模型,对所述目标实体进行知识推理,得到所述目标实体对应的关联抽象实体和对所述关联抽象实体的推理过程;其中,将所述推理过程融入提示中,利用大语言模型生成所述待预测文本中的头实体和尾实体之间的目标预测关系,包括:基于所述推理过程,构造种子样例集;所述种子样例集包括每个类别标注对应的至少一个样例;基于所述种子样例集,利用上下文学习对大语言模型进行提示,生成所述待预测文本中的头实体和尾实体之间的目标预测关系;其中,所述推理过程包括三段式推理步骤,所述三段式推理步骤包括:标识出头实体在相关文本中的抽象实体;标识出尾实体在相关文本中的抽象实体;应用原文本中相关文字作为证据,为所述头实体、关系类别标签和所述尾实体构建连贯的句子。 马 克 数 据 网