← 返回列表

基于深度学习网络的复杂条件字符识别方法

申请号: CN202311347751.6
申请人: 无锡九霄科技有限公司
申请日期: 2023/10/18

摘要文本

本发明公开了基于深度学习网络的复杂条件字符识别方法,属于字符识别技术领域。本发明的字符识别方法采用的系统包括:图像预处理模块、高通滤波引导模块、特征提取模块、检测模块。图像预处理模块用于消除字符随机角度影响;高通滤波引导模块用于强化字符的高频特征,突出其边缘信息;特征提取模块用于强调高频边缘信息消除模糊的同时抑制连续杂波特征干扰,检测模块设计解耦检测头,使得网络更加分别专注于回归和分类输出,本发明解决了工况复杂、脏污和水渍以及产线高速运动引起的日期字符杂波噪声干扰和运动模糊的问题,有效地提升了识别精度和效率。

专利详细信息

项目 内容
专利名称 基于深度学习网络的复杂条件字符识别方法
专利类型 发明申请
申请号 CN202311347751.6
申请日 2023/10/18
公告号 CN117409400A
公开日 2024/1/16
IPC主分类号 G06V20/62
权利人 无锡九霄科技有限公司
发明人 丁志鹏; 吴静静; 庄祉珊; 肖天行
地址 江苏省无锡市滨湖区金融二街8号18楼

专利主权项内容

1.一种字符识别方法,其特征在于,所述字符识别方法包括:步骤1:采集待识别的字符图像并进行预处理,包括:提取字符区域,对字符区域进行旋转矫正;步骤2:针对预处理后的字符图像,采用高通滤波器引导模块强化字符的高频特征,突出边缘信息,减小运动模糊带来的特征丢失;步骤3:采用patch partition对所述步骤2得到的强化特征图进行分块,然后依次通过4个层级式的特征提取模块完成特征提取,每个特征提取模块包括:Swin T CSPbottleneck;步骤4:第2、3、4个所述Swin T CSP bottleneck生成的特征图被输入至YOLOv5的FPN+PAN层,分别自顶向下和自底向上进行多尺度特征融合;步骤5:将所述步骤4得到的融合特征图输入YOLOv5头部的轻量解耦合检测头,得到回归框和类别,在图像上框出字符识别结果,同时返回识别文本。。 (来源 马克数据网)