一种基于法律文书结构特点的案由识别方法及装置
摘要文本
本发明公开了一种基于法律文书结构特点的案由识别方法及装置。本方法包括:1)根据确定支持的案件类型和文书类型,获取每一案件类型的多个案件;2)针对每一案件类型,构建该案件类型的标准案由库;3)根据每一案件类型的标准案由库,结合该案件类型的案件文书数据的段落特点相互校验的方式构建训练样本集;4)计算每一样本的案由名称在案由提取段中的位置,得到符合UIE模型的训练集格式的训练样本集合U;5)利用训练样本集合U训练所述UIE模型,得到命名体识别模型;6)将待处理文书数据集中一案件A的文书数据输入命名体识别模型,得到该案件A的备选案由集;将该备选案由集与对应的标准案由库进行匹配,得到案件A的案由名称。
申请人信息
- 申请人:中国司法大数据研究院有限公司
- 申请人地址:100144 北京市石景山区金府路29号院4号楼5层505室
- 发明人: 中国司法大数据研究院有限公司
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种基于法律文书结构特点的案由识别方法及装置 |
| 专利类型 | 发明申请 |
| 申请号 | CN202311418562.3 |
| 申请日 | 2023/10/30 |
| 公告号 | CN117350294A |
| 公开日 | 2024/1/5 |
| IPC主分类号 | G06F40/295 |
| 权利人 | 中国司法大数据研究院有限公司 |
| 发明人 | 崔世琦; 邴丰; 吴正午; 王光奇; 张凡凡 |
| 地址 | 北京市石景山区金府路29号院4号楼5层505室 |
专利主权项内容
1.一种基于法律文书结构特点的案由识别方法,其步骤包括:1)根据确定支持的案件类型和文书类型,获取每一案件类型的多个案件,所述案件包括各所述文书类型的文书数据;获取每一所述文书数据的案由提取段,包括标题段、审理经过段、本院认为段;2)针对每一案件类型,结合该案件类型对应的法标库中标准案由信息和该案件类型的各案件的案由结构信息,构建该案件类型的标准案由库;3)根据每一案件类型的标准案由库,结合该案件类型的案件文书数据的段落特点相互校验的方式构建训练样本集,所述训练样本集中每一样本包括一案件的案由和案由提取段;4)计算每一样本的案由名称在案由提取段中的位置,得到符合UIE模型的训练集格式的训练样本集合U,训练样本集合U中的每一训练样本包括案由提取段、案由名称及其在案由提取段中的下标位置信息;5)利用所述训练样本集合U训练所述UIE模型,得到命名体识别模型AY_MODEL;6)将待处理文书数据集中一案件A的文书数据输入命名体识别模型AY_MODEL,得到该案件A的备选案由集;将该案件A的备选案由集中的元素与该案件A的案件类型对应的标准案由库中的元素进行相似度匹配,若找到完全匹配的元素则将其作为该案件A的案由名称输出,否则采用孪生网络计算该案件A的备选案由集中的元素与该案件A的案件类型对应的标准案由库中的元素相似度,根据相似度计算结果输出该案件A的案由名称。 来自: