一种文本识别方法及装置

申请号: CN201810636441.9

申请人: 北京搜狗科技发展有限公司

申请日期: 2018年6月20日

摘要文本

本申请实施例提供了一种文本识别方法和装置，其中所述方法包括获取图像样本的位置信息，根据位置信息，生成图像样本的图像特征，基于图像样本以及对应标记的文本数据，创建基于图像特征识别图像中文本的识别数据集合，基于识别数据集合识别目标图像，获得目标文本，使得在训练模型时，将位置信息提供到模型中来生成图像特征，引导训练时模型的注意力，通过位置信息来指导、优化其他图像特征的训练学习过程，使得训练更有针对性，提高训练速度，并在识别图像中文本时取得更高的识别准确率。

申请人信息

申请人:北京搜狗科技发展有限公司
申请人地址:100084 北京市海淀区中关村东路1号院9号楼搜狐网络大厦9层01房间
发明人: 北京搜狗科技发展有限公司

专利详细信息

项目	内容
专利名称	一种文本识别方法及装置
专利类型	发明授权
申请号	CN201810636441.9
申请日	2018年6月20日
公告号	CN110619325B
公开日	2024年3月8日
IPC主分类号	G06V30/14
权利人	北京搜狗科技发展有限公司
发明人	王子豪; 马龙
地址	北京市海淀区中关村东路1号院9号楼搜狐网络大厦9层01房间

专利主权项内容

1.一种文本识别方法，其特征在于，包括：根据预设卷积参数对图像样本进行特征提取，得到所述图像样本中划分的各个区域对应的第一特征点；根据所述各个区域的位置关系，由所述第一特征点组成包含位置信息的第一特征图；利用卷积神经网络对所述图像样本进行特征提取，得到预设层数的第二特征图；结合所述第一特征图和至少一层第二特征图，得到第三特征图；基于所述图像样本以及对应标记的文本数据，创建基于图像特征识别图像中文本的识别数据集合；基于所述识别数据集合识别目标图像，获得目标文本。

一种文本识别方法及装置

摘要文本

申请人信息

专利详细信息

专利主权项内容

热门技术领域

快速入口

专利技术资料

一种文本识别方法及装置

摘要文本

申请人信息

专利详细信息

专利主权项内容

相关专利推荐

一种焊接管路的辅助装置

一种导轨滑块刚性疲劳测试装置及其测试方法

X射线管及其阴极冷却装置、管芯组件

双歧杆菌分离培养方法

一种用于电子级硫酸生产废液的回收处理装置

自动化全内置超导磁铁磁场强度测量装置及测量方法

热门技术领域

快速入口

专利技术资料