← 返回列表

基于深度学习的财务数据校验方法及系统

申请号: CN202311744548.2
申请人: 山东工程职业技术大学
申请日期: 2023/12/19

摘要文本

本发明提供了一种基于深度学习的财务数据校验方法及系统,对预处理后财务图像数据进行分割,得到多个分割后的子图像;对任一张子图像,采用预训练的文字识别模型进行文字识别,采用预训练的数字识别模型进行数字识别,将识别到的文字和数字进行组合,将组合结果与人工输入的财务数据进度对比校验,当校验结果一致时,判定人工输入的财务数据正确;当校验结果不一致时,再次对此子图像进行文字识别和数字识别并进行再次校验,当再次校验结果与首次校验结果一致时,生成校验告警信息。本发明提高了文字识别的精度和效率。

专利详细信息

项目 内容
专利名称 基于深度学习的财务数据校验方法及系统
专利类型 发明授权
申请号 CN202311744548.2
申请日 2023/12/19
公告号 CN117422958B
公开日 2024/3/19
IPC主分类号 G06V10/776
权利人 山东工程职业技术大学
发明人 苗文婧; 隗茂虎; 刁振宇
地址 山东省济南市经十东路6196号

专利主权项内容

1.一种基于深度学习的财务数据校验方法,其特征在于,包括以下过程:获取待处理的财务图像数据并进行预处理,对预处理后财务图像数据进行分割,得到多个分割后的子图像;对任一张子图像,采用预训练的文字识别模型进行文字识别,采用预训练的数字识别模型进行数字识别,将识别到的文字和数字进行组合,将组合结果与人工输入的财务数据进行对比校验,当校验结果一致时,判定人工输入的财务数据正确;当校验结果不一致时,再次对所述的任一张子图像进行文字识别和数字识别并进行再次校验,当再次校验结果与首次校验结果一致时,生成校验告警信息;其中,预训练的文字识别模型中,经过卷积层提取的特征向量输入残差单元,将输入特征向量与残差计算后的特征向量相加作为残差单元的输出,经一维卷积层转换为多维特征向量,取特征向量概率最大的索引值作为文字识别结果;残差单元包括依次连接的1×1卷积层、Batch Norm & ReLu层、3×3卷积层、BatchNorm & ReLu层以及Batch Norm层;特征向量的提取,包括依次连接的第一卷积层、第二卷积层、第一最大池化层、第三卷积层、第四卷积层、第二最大池化层、第五卷积层、第六卷积层、第七卷积层、第八卷积层、第九卷积层、第一全连接层和第一Softmax层;预训练的数字识别模型,包括依次连接的第十卷积层、第十一卷积层、第三最大池化层、第十二卷积层、第十三卷积层、第四最大池化层、第十四卷积层、第十五卷积层、第二全连接层和第二Softmax层;在进行字符识别的过程中,对无法识别的特殊字采用“-”替代,按照规则去掉重复字符和间隔字符,如果同一字符连续出现,则表示字符重复,保留1个字符,如果中间有间隔字符,则表示该字符不重复,保留所有字符;对印章图像中的文字和数字进行识别,首先进行印章图像的处理,具体包括:采用极坐标变换法将截取的圆形印章文字拉伸至水平,首先,根据模型输出的印章位置确定印章的中心点位置()和半径,然后将直角坐标系转化为极坐标系;x,yr根据原图像分别计算出缩放比例:

;式中:为原图像的长,为原图像的宽,为最大圆半径,然后根据缩放比例计算出极坐标系下点的坐标,经过变换后的图像采用上述预训练的文字识别模型和数字识别模型进行识别,得到最终的印章数据识别结果。src.colssrc.rowsmaxRadius 来源:马 克 团 队