← 返回列表
一种文本识别方法、装置、计算机设备、存储介质及产品
摘要文本
本申请实施例公开了一种文本识别方法、装置、计算机设备、存储介质及产品,该方法包括:获取样本图像数据集,样本图像数据集包括多个样本图像,各个样本图像中包括文本信息以及为每个文本信息添加的文本类别标签;获取各个样本图像中的一个或多个文本区域图像,并获取各个文本区域图像在对应各个样本图像中的区域信息,区域信息包括位置信息和/或尺寸信息;将各个文本区域图像、各个区域信息以及各个文本类别标签输入预设的神经网络模型进行训练,得到文本识别模型;获取待处理图像,并将该待处理图像输入该文本识别模型,得到该待处理图像的文本和文本类别,可有效识别出图像中的文本和文本类别,提高文本识别的准确性。。 (来 自 专利查询网)
申请人信息
- 申请人:书行科技(北京)有限公司
- 申请人地址:100029 北京市朝阳区安定路5号院5号楼18层01单元
- 发明人: 书行科技(北京)有限公司
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种文本识别方法、装置、计算机设备、存储介质及产品 |
| 专利类型 | 发明申请 |
| 申请号 | CN202311301253.8 |
| 申请日 | 2023/10/9 |
| 公告号 | CN117727037A |
| 公开日 | 2024/3/19 |
| IPC主分类号 | G06V30/146 |
| 权利人 | 书行科技(北京)有限公司 |
| 发明人 | 隆超 |
| 地址 | 北京市朝阳区安定路5号院5号楼18层01单元 |
专利主权项内容
1.一种文本识别方法,其特征在于,包括:获取样本图像数据集,所述样本图像数据集包括多个样本图像,各个样本图像中包括文本信息以及为每个文本信息添加的文本类别标签;获取所述各个样本图像中的一个或多个文本区域图像,并获取所述一个或多个文本区域图像中的各个文本区域图像在对应各个样本图像中的区域信息,所述区域信息包括位置信息和/或尺寸信息;将所述各个文本区域图像、所述各个文本区域图像在对应各个样本图像中的区域信息以及所述各个样本图像对应的每个文本信息的文本类别标签输入预设的神经网络模型进行训练,得到文本识别模型;获取待处理图像,并将所述待处理图像输入所述文本识别模型,得到所述待处理图像的文本信息,所述文本信息包括文本和文本类别。 更多数据: