← 返回列表

一种文本识别方法及装置

申请号: CN201810636441.9
申请人: 北京搜狗科技发展有限公司
申请日期: 2018年6月20日

摘要文本

本申请实施例提供了一种文本识别方法和装置,其中所述方法包括获取图像样本的位置信息,根据位置信息,生成图像样本的图像特征,基于图像样本以及对应标记的文本数据,创建基于图像特征识别图像中文本的识别数据集合,基于识别数据集合识别目标图像,获得目标文本,使得在训练模型时,将位置信息提供到模型中来生成图像特征,引导训练时模型的注意力,通过位置信息来指导、优化其他图像特征的训练学习过程,使得训练更有针对性,提高训练速度,并在识别图像中文本时取得更高的识别准确率。

专利详细信息

项目 内容
专利名称 一种文本识别方法及装置
专利类型 发明授权
申请号 CN201810636441.9
申请日 2018年6月20日
公告号 CN110619325B
公开日 2024年3月8日
IPC主分类号 G06V30/14
权利人 北京搜狗科技发展有限公司
发明人 王子豪; 马龙
地址 北京市海淀区中关村东路1号院9号楼搜狐网络大厦9层01房间

专利主权项内容

1.一种文本识别方法,其特征在于,包括:根据预设卷积参数对图像样本进行特征提取,得到所述图像样本中划分的各个区域对应的第一特征点;根据所述各个区域的位置关系,由所述第一特征点组成包含位置信息的第一特征图;利用卷积神经网络对所述图像样本进行特征提取,得到预设层数的第二特征图;结合所述第一特征图和至少一层第二特征图,得到第三特征图;基于所述图像样本以及对应标记的文本数据,创建基于图像特征识别图像中文本的识别数据集合;基于所述识别数据集合识别目标图像,获得目标文本。