← 返回列表
一种面向裁判文书的文档级智能问答实现方法
摘要文本
本发明公开了一种面向裁判文书的文档级智能问答实现方法,其步骤包括:1)获取目标裁判文书;2)采对裁判文书的内容进行分割得到多个文本块,生成每一所述文本块的表示向量并存入文书向量数据库VB1中;3)根据从裁判文书中抽取的实体、关系和属性构建一知识图谱,根据知识图谱中每一三元组生成一知识条目,构建知识集合;将知识条目转为表示向量存入知识向量数据库VB2中;4)根据用户的问题Q生成一问题向量;5)将问题向量分别与VB1、VB2中每一表示向量进行文本相似度计算,获取相似文本集A1、相似知识集A2;6)基于A1、A2,采用大语言模型生成标准答案输出。本发明提升了面向裁判文书问答的准确率。
申请人信息
- 申请人:中国司法大数据研究院有限公司
- 申请人地址:100144 北京市石景山区金府路29号院4号楼5层505室
- 发明人: 中国司法大数据研究院有限公司
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种面向裁判文书的文档级智能问答实现方法 |
| 专利类型 | 发明申请 |
| 申请号 | CN202311409116.6 |
| 申请日 | 2023/10/27 |
| 公告号 | CN117609440A |
| 公开日 | 2024/2/27 |
| IPC主分类号 | G06F16/332 |
| 权利人 | 中国司法大数据研究院有限公司 |
| 发明人 | 魏芸菲; 孙晓锐; 张育龙; 吴正午; 崔世琦 |
| 地址 | 北京市石景山区金府路29号院4号楼5层505室 |
专利主权项内容
1.一种面向裁判文书的文档级智能问答实现方法,其步骤包括:1)获取目标文书,所述目标文书为用户待分析的裁判文书;2)采用文书分段技术对所述裁判文书的内容进行分割得到多个文本块,生成每一所述文本块的表示向量并存入文书向量数据库VB1中;3)根据从所述裁判文书中抽取的实体、关系和属性构建一知识图谱,根据所述知识图谱中每一三元组(实体、关系、属性)生成一知识条目,构建由多个所述知识条目组成的知识集合;将所述知识集合中的知识条目转为表示向量存入知识向量数据库VB2中;4)根据用户的问题Q生成一问题向量;5)将所述问题向量与所述文书向量数据库VB1中每一表示向量进行文本相似度计算,获取相似文本集A1;将所述问题向量与所述知识向量数据库VB2中每一表示向量进行文本相似度计算,获取相似知识集A2;6)基于步骤5)所得相似文本集A1、相似知识集A2,采用大语言模型生成所述问题Q的标准答案输出。