一种司法数据的处理方法及系统
摘要文本
本发明提供一种司法数据的处理方法及系统,所述方法包括:获取需要预测司法数据的待办理案件的案件信息,所述司法数据包括罪名,所述案件信息包括所述待办理案件的文本信息。将文本信息作为预先建立的罪名预测模型的输入进行预测得到法条预测结果,并基于法条预测结果得到待办理案件的预测罪名,其中,所述罪名预测模型由基于样本数据和类标训练神经网络模型获得。本发明提供的司法数据处理方法,通过利用已经公开的司法文书数据预先训练神经网络模型得到罪名预测模型,将待办理案件的文本信息输入预测模型中进行预测得到对应的预测罪名,能缩短判决时间,提高判决准确性和效率。
申请人信息
- 申请人:北京国双科技有限公司
- 申请人地址:100083 北京市海淀区北四环中路229号海泰大厦4层南401号
- 发明人: 北京国双科技有限公司
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种司法数据的处理方法及系统 |
| 专利类型 | 发明授权 |
| 申请号 | CN201811156903.3 |
| 申请日 | 2018年9月30日 |
| 公告号 | CN110969017B |
| 公开日 | 2024年2月20日 |
| IPC主分类号 | G06F40/289 |
| 权利人 | 北京国双科技有限公司 |
| 发明人 | 陈华杰 |
| 地址 | 北京市海淀区北四环中路229号海泰大厦4层南401号 |
专利主权项内容
1.一种司法数据的处理方法,其特征在于,所述方法包括:获取需要预测司法数据的待办理案件的案件信息,所述司法数据包括罪名,所述案件信息包括所述待办理案件的文本信息;将所述文本信息作为预先建立的罪名预测模型的输入进行预测得到法条预测结果,并基于所述法条预测结果得到所述待办理案件的预测罪名,其中,所述罪名预测模型由基于样本数据和类标训练神经网络模型获得;其中,将所述文本信息作为预先建立的罪名预测模型的输入进行预测得到法条预测结果,并基于所述法条预测结果得到所述待办理案件的预测罪名,包括:将所述文本信息输入所述罪名预测模型的输入层进行分词处理,得到离散词语,并将所述离散词语传输至所述罪名预测模型的词编码层;在所述词编码层,利用预先训练的词向量模型,将所述离散词语转化为预设维数的离散词语向量,并将所述离散词语向量传输至所述罪名预测模型的双向循环神经网络层;在所述双向循环神经网络层对所述离散词语向量进行训练,得到第一信息,其中,所述双向循环神经网络层中的从左往右的循环神经网络在输出当前时刻信息时包含了前面时刻的信息,所述双向循环神经网络层中的从右往左的循环神经网络在输出当前时刻信息时包含了后面时刻的信息,所述双向循环神经网络在输出第一信息时包含了上下文的信息;合并所述第一信息和所述离散词语向量,得到第二信息,将所述第二信息传输至所述罪名预测模型的卷积神经网络层;在所述卷积神经网络层,提取所述第二信息的局部特征,得到二维向量的第一特征信息,将所述第一特征信息传输至所述罪名预测模型的全局特征层;在所述全局特征层对所述第一特征信息进行处理,得到一维向量的第二特征信息;获取所述第二特征信息中包含的法条特征数据和罪名特征数据,基于所述法条特征数据和罪名特征数据,确定所述待办理案件的预测罪名,其中,所述基于所述法条特征数据和罪名特征数据,确定所述待办理案件的预测罪名,包括:抽取所述法条特征数据的部分特征数据;合并所述部分特征数据与所述罪名特征数据,得到所述待办理案件的预测罪名。