← 返回列表

一种基于数据分析的票据图文识别方法及系统

申请号: CN202311732736.3
申请人: 广州市省信软件有限公司
更新日期: 2026-03-09

专利详细信息

项目 内容
专利名称 一种基于数据分析的票据图文识别方法及系统
专利类型 发明授权
申请号 CN202311732736.3
申请日 2023/12/18
公告号 CN117423126B
公开日 2024/3/8
IPC主分类号 G06V30/412
权利人 广州市省信软件有限公司
发明人 林立磐; 刘智国; 曾俊毅; 李伟; 陈瑞翔; 王镇彬
地址 广东省广州市黄埔区开发区科学大道50号1408房

摘要文本

广州市省信软件有限公司获取“一种透气窗帘布”专利技术,本发明涉及图像数据处理领域,更具体地,本发明涉及一种基于数据分析的票据图文识别方法及系统,方法包括:采集票据图像并进行预处理,对灰度图像进行二值化,确定所述目标像素点的灰度值,根据所述目标像素点的灰度值与邻域像素点的灰度值,得到所述灰度值变化量;根据所述灰度值变化量和原图像的色彩通道分量值,计算所述目标像素点的邻域像素点的增强概率,对所述目标像素点的邻域像素点进行增强,增强后进行票据内容的识别。本发明根据增强概率,实现准确识别需要保留的像素点,能够尽可能的在二值化图像中保留字符、章印、边框等,同时尽可能消除背景对于内容的影响,在票据内容识别时,提高识别的效率和准确率。

专利主权项内容

1.一种基于数据分析的票据图文识别方法,其特征在于,包括:采集票据图像并进行预处理,得到灰度图像,对所述灰度图像进行二值化,得到二值化图像;根据所述二值化图像中目标像素点的位置,确定所述目标像素点在灰度图像中的邻域像素点的灰度值;依次计算所述目标像素点与邻域像素点的灰度差值,得到所述邻域像素点的灰度值变化量;根据所述灰度值变化量和原图像的色彩通道分量值,计算所述目标像素点的邻域像素点的增强概率;根据所述增强概率,对所述目标像素点的邻域像素点进行增强,获得增强后的二值化图像;对所述增强后的二值化图像进行票据的内容识别;对所述目标像素点的邻域像素点进行增强,包括:计算所述二值化图像中任意两个像素点的增强概率的第一差值,遍历计算所有所述第一差值的第一平均值;计算所述二值化图像中所述目标像素点与周围邻域像素点的增强概率的第二差值,遍历计算所有所述第二差值的第二平均值,根据所述第二平均值利用均值聚类算法进行二分类,得到两个聚类簇,其中,所述聚类簇分为:概率差值大的聚类簇和概率差值小的聚类簇;计算所述两个聚类簇的增强概率的差值序列,使用最小二乘法对差值序列进行拟合,得到拟合直线,根据所述差值序列中的点,计算所述差值序列到拟合直线最短距离的平均值,判断差值序列的连续性;计算所述第一平均值和第二平均值的第三差值,其中,所述第三差值为差值序列的连续性的加权,以得到判断的增强结果参数;所述增强结果参数满足下述关系式:其中,表示判断的增强结果参数,/>表示差值序列中的点到拟合直线最短距离的平均值,/>表示第一平均值与第二平均值的差值;根据所述增强结果参数的预设阈值,判断增强效果,包括:设置增强结果参数的预设阈值为;响应于增强结果参数小于预设阈值/>,需要对所述目标像素点的邻域像素点进行增强。