← 返回列表

基于OCR技术的扫描文件矢量化转换方法

申请号: CN202311376888.4
申请人: 北京点聚信息技术有限公司
申请日期: 2023/10/23

摘要文本

本发明涉及图像处理技术领域,提出了基于OCR技术的扫描文件矢量化转换方法,包括:对报纸的版式文件通过扫描,得到栅格文件;对栅格文件中所有栅格得到若干初始类别及每个初始类别的特征框;得到不同种尺度的特征框之间的相似程度及若干第一类别;根据特征框的分布通过聚类得到若干区域;得到若干起始特征框及每个区域的若干初始基准线;获取每个区域的波动范围并调整初始基准线得到若干第一基准线;获取每个区域的若干最佳分割框;对每个最佳分割框获取若干特征栅格点,作为采样点对报纸版式文件的栅格文件进行矢量化转换。本发明旨在解决新闻报纸等版式文件通过OCR扫描后由于精度影响会导致栅格出现偏差而导致矢量文件失真的问题。

专利详细信息

项目 内容
专利名称 基于OCR技术的扫描文件矢量化转换方法
专利类型 发明申请
申请号 CN202311376888.4
申请日 2023/10/23
公告号 CN117475438A
公开日 2024/1/30
IPC主分类号 G06V30/148
权利人 北京点聚信息技术有限公司
发明人 范红达; 沙伏生; 赵云; 庄玉龙; 朱静宇; 杨瑞钦; 陆猛; 郭尚
地址 北京市海淀区永丰路9号院3号楼2层101

专利主权项内容

1.基于OCR技术的扫描文件矢量化转换方法,其特征在于,该方法包括以下步骤:对报纸的版式文件通过OCR技术扫描,得到栅格文件;对栅格文件中所有栅格根据灰度值及分布进行聚类,得到若干初始类别及每个初始类别的特征框;根据不同种尺度的特征框的分布及邻域范围内其他特征框的分布,得到不同种尺度的特征框之间的相似程度及若干第一类别;根据特征框的分布通过聚类得到若干区域;根据特征框及邻域范围内特征框分布,得到若干起始特征框及每个区域的若干初始基准线;根据特征框所属第一类别,获取每个区域的波动范围并调整初始基准线得到若干第一基准线;根据同一区域内不同第一基准线上特征框的变化,获取每个区域的若干最佳分割框;对每个最佳分割框获取若干特征栅格点,作为采样点对报纸版式文件的栅格文件进行矢量化转换。 微信公众号马克数据网