← 返回列表

一种面向裁判文书的文档级智能问答实现方法

申请号: CN202311409116.6
申请人: 中国司法大数据研究院有限公司
申请日期: 2023/10/27

摘要文本

本发明公开了一种面向裁判文书的文档级智能问答实现方法,其步骤包括:1)获取目标裁判文书;2)采对裁判文书的内容进行分割得到多个文本块,生成每一所述文本块的表示向量并存入文书向量数据库VB1中;3)根据从裁判文书中抽取的实体、关系和属性构建一知识图谱,根据知识图谱中每一三元组生成一知识条目,构建知识集合;将知识条目转为表示向量存入知识向量数据库VB2中;4)根据用户的问题Q生成一问题向量;5)将问题向量分别与VB1、VB2中每一表示向量进行文本相似度计算,获取相似文本集A1、相似知识集A2;6)基于A1、A2,采用大语言模型生成标准答案输出。本发明提升了面向裁判文书问答的准确率。

专利详细信息

项目 内容
专利名称 一种面向裁判文书的文档级智能问答实现方法
专利类型 发明申请
申请号 CN202311409116.6
申请日 2023/10/27
公告号 CN117609440A
公开日 2024/2/27
IPC主分类号 G06F16/332
权利人 中国司法大数据研究院有限公司
发明人 魏芸菲; 孙晓锐; 张育龙; 吴正午; 崔世琦
地址 北京市石景山区金府路29号院4号楼5层505室

专利主权项内容

1.一种面向裁判文书的文档级智能问答实现方法,其步骤包括:1)获取目标文书,所述目标文书为用户待分析的裁判文书;2)采用文书分段技术对所述裁判文书的内容进行分割得到多个文本块,生成每一所述文本块的表示向量并存入文书向量数据库VB1中;3)根据从所述裁判文书中抽取的实体、关系和属性构建一知识图谱,根据所述知识图谱中每一三元组(实体、关系、属性)生成一知识条目,构建由多个所述知识条目组成的知识集合;将所述知识集合中的知识条目转为表示向量存入知识向量数据库VB2中;4)根据用户的问题Q生成一问题向量;5)将所述问题向量与所述文书向量数据库VB1中每一表示向量进行文本相似度计算,获取相似文本集A1;将所述问题向量与所述知识向量数据库VB2中每一表示向量进行文本相似度计算,获取相似知识集A2;6)基于步骤5)所得相似文本集A1、相似知识集A2,采用大语言模型生成所述问题Q的标准答案输出。