一种文本识别方法、装置、计算机设备、存储介质及产品

申请号: CN202311301253.8

申请人: 书行科技(北京)有限公司

申请日期: 2023/10/9

摘要文本

本申请实施例公开了一种文本识别方法、装置、计算机设备、存储介质及产品，该方法包括：获取样本图像数据集，样本图像数据集包括多个样本图像，各个样本图像中包括文本信息以及为每个文本信息添加的文本类别标签；获取各个样本图像中的一个或多个文本区域图像，并获取各个文本区域图像在对应各个样本图像中的区域信息，区域信息包括位置信息和/或尺寸信息；将各个文本区域图像、各个区域信息以及各个文本类别标签输入预设的神经网络模型进行训练，得到文本识别模型；获取待处理图像，并将该待处理图像输入该文本识别模型，得到该待处理图像的文本和文本类别，可有效识别出图像中的文本和文本类别，提高文本识别的准确性。。（来自专利查询网）

申请人信息

申请人:书行科技(北京)有限公司
申请人地址:100029 北京市朝阳区安定路5号院5号楼18层01单元
发明人: 书行科技(北京)有限公司

专利详细信息

项目	内容
专利名称	一种文本识别方法、装置、计算机设备、存储介质及产品
专利类型	发明申请
申请号	CN202311301253.8
申请日	2023/10/9
公告号	CN117727037A
公开日	2024/3/19
IPC主分类号	G06V30/146
权利人	书行科技(北京)有限公司
发明人	隆超
地址	北京市朝阳区安定路5号院5号楼18层01单元

专利主权项内容

1.一种文本识别方法，其特征在于，包括：获取样本图像数据集，所述样本图像数据集包括多个样本图像，各个样本图像中包括文本信息以及为每个文本信息添加的文本类别标签；获取所述各个样本图像中的一个或多个文本区域图像，并获取所述一个或多个文本区域图像中的各个文本区域图像在对应各个样本图像中的区域信息，所述区域信息包括位置信息和/或尺寸信息；将所述各个文本区域图像、所述各个文本区域图像在对应各个样本图像中的区域信息以及所述各个样本图像对应的每个文本信息的文本类别标签输入预设的神经网络模型进行训练，得到文本识别模型；获取待处理图像，并将所述待处理图像输入所述文本识别模型，得到所述待处理图像的文本信息，所述文本信息包括文本和文本类别。更多数据：

一种文本识别方法、装置、计算机设备、存储介质及产品

摘要文本

申请人信息

专利详细信息

专利主权项内容

热门技术领域

快速入口

专利技术资料

特别鸣谢

一种文本识别方法、装置、计算机设备、存储介质及产品

摘要文本

申请人信息

专利详细信息

专利主权项内容

相关专利推荐

一种高频变压器串并联倍流输出的整流电路

沙发(HSN-6053)

时延对齐方法及装置

一种高脱色竹制活性碳及其制备工艺

床(HSN-B016)

座椅部件(GF-82733H)

热门技术领域

快速入口

专利技术资料

特别鸣谢