一种印章区域表格线检测方法
申请人信息
- 申请人:南昌航空大学
- 申请人地址:330000 江西省南昌市丰和南大道696号
- 发明人: 南昌航空大学
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种印章区域表格线检测方法 |
| 专利类型 | 发明授权 |
| 申请号 | CN202410012916.2 |
| 申请日 | 2024/1/4 |
| 公告号 | CN117523592B |
| 公开日 | 2024/4/2 |
| IPC主分类号 | G06V30/413 |
| 权利人 | 南昌航空大学 |
| 发明人 | 杨词慧; 李千红 |
| 地址 | 江西省南昌市丰和南大道696号 |
摘要文本
本发明公开了一种印章区域表格线检测方法,该方法包括以下步骤:步骤S1;读取表格文档图像,对表格文档图像进行预处理;步骤S2;检测表格文档图像中的表格线,对表格线进行类型判断;步骤S3;对表格线进行排序;步骤S4;对表格文档图像的边界线进行检测;步骤S5;对表格文档图像中的印章区域进行检测;步骤S6;对印章区域内的线段自动补齐。本发明主要基于表格文档图像内表格线之间的关系,结合表格文档图像中的印章区域特征,对包含印章的表格文档图像中印章区域内的表格线进行自动检测和补齐。本发明适用于检测并还原包含印章的表格文档图像的表格线,可有效避免印章对表格线检测的不良影响,表格线还原准确,检测速度快。 ()
专利主权项内容
1.一种印章区域表格线检测方法,其特征在于:该方法包括以下步骤:步骤S1;表格文档图像预处理:读取表格文档图像,将表格文档图像转换成灰度图像,采用图像二值化算法对灰度图像进行图像二值化操作,得到二值化图像;IIIgIgIb步骤S2;表格线类型判断:对二值化图像进行直线检测,得到表格线集合,对表格线集合中的每一条直线进行类型判断,其中表格线类型分为竖线段和横线段;IbLL步骤S3;表格线排序:根据竖线段的坐标,按照从小到大的顺序,对竖线段集合中的每一条竖线段进行排序;根据横线段的坐标,按照从小到大的顺序,对横线段集合中的每一条横线段进行排序;xLvyLh步骤S4;表格文档图像边界线检测:根据已排序的竖线段集合和横线段集合,对表格上边界线、下边界线/>、左边界线/>、右边界线/>进行检测;LvLh步骤S5;印章区域检测:采用印章检测算法对表格文档图像中的印章区域进行检测,将检测到的印章区域加入印章区域集合;IS步骤S6;印章区域内线段自动补齐:对起点或终点位于印章区域内的线段进行自动补齐;步骤S6中对起点或终点位于印章区域内的竖线段和横线段进行自动补齐,具体步骤为:步骤S61,令表示检测到的表格文档图像的左边界线/>的坐标,令/>表示检测到的表格文档图像的右边界线/>的坐标,令/>表示检测到的表格文档图像的上边界线/>的坐标,令/>表示检测到的表格文档图像的下边界线/>的坐标;采用以下公式计算表格文档图像的中心点坐标:IxIxIyIyI
;其中,表示表格文档图像中心点的坐标;/>表示表格文档图像中心点的坐标;IxI<步骤S62,遍历印章区域集合中的每一个印章区域<=1, 2, …, <表示印章区域集合中印章区域的个数;<<<<<<<步骤S63,计算印章区域中心点坐标:令表示印章区域的左边界线的坐标,令表示印章区域的右边界线的坐标,令/>表示印章区域的上边界线的坐标, 令表示印章区域的下边界线的坐标;采用以下公式计算印章区域的中心点坐标:<<<<<<<<<<<<<<
<其中,表示印章区域中心点的坐标;/>表示印章区域中心点的坐标;<<<<<<步骤S64,采用以下方法对印章区域的方位进行判定:<i如果,则判定印章区域位于表格文档图像的左方位;siI如果,则判定印章区域位于表格文档图像的右方位;siI如果,则判定印章区域位于表格文档图像的上方位;siI如果,则判定印章区域位于表格文档图像的下方位;siI其中,每一个印章区域的方位划分为:左上方位、左下方位,右上方位、右下方位;si步骤S65,印章区域最近线获取;从印章区域的上边界线往上找到距印章区域的上边界线最近的一条横线段,令表示横线段的中心点的坐标;从印章区域的下边界线往下找到距印章区域的下边界线最近的一条横线段,令/>表示横线段的中心点的坐标;从印章区域的左边界线往左找到距印章区域的左边界线最近的一条竖线段,令/>表示竖线段的中心点的坐标;从印章区域的右边界线往右找到距印章区域的右边界线最近的一条竖线段,令/>表示竖线段的中心点的坐标;sisih1nh1nysisih2nh2nysisiv1nv1nxsisiv2nv2nx对印章区域内的竖线段进行自动补齐,具体步骤为:si步骤S661,从竖线段集合中筛选出其中一个端点的坐标在区域、坐标在区域/>的所有竖线段,将其加入到待补齐竖线段集合;对于待补齐竖线段集合中的当前遍历的第条竖线段,其中/>,为待补齐竖线段集合中的表格线的条数,令/>表示当前遍历的第条竖线段的上端点的坐标,令/>表示当前遍历的第条竖线段的下端点的坐标;LvxyLsvLsvjlv, jzLsvjlv, jyjlv, jy步骤S662,参考竖线段确定;当印章区域位于表格文档图像的左方位时,从印章区域的右边界线往右查找坐标大于印章区域最近左边界线的坐标的第一条竖线段,令其为参考竖线段;当印章区域位于表格文档图像的右方位时,从印章区域的左边界线往左查找坐标小于印章区域最近左边界线的坐标/>的第一条竖线段,令其为参考竖线段;令/>表示参考竖线段的上端点的坐标,令/>表示参考竖线段的下端点的坐标;siIsixxlv0siIsixxlv0lv0ylv0y步骤S663,当印章区域位于表格文档图像的上方位时:siI从横线段集合中筛选出距离参考竖线段的上端点最近的横线段;Lhlv0lh1如果,则将当前遍历的第条竖线段沿着向上端点的方向延长至与横线段相交的位置;jlv, jlh1如果, 则设置投影框宽度值1,取以当前遍历的第条竖线段为中心线、投影框宽度值为1、上边界线的坐标为/>、下边界线坐标为/>的矩形框,对矩形框进行水平方向投影;令投影得到的一维数组中非零元素个数和占矩形框中所有元素个数比例为,给定比例阈值,如果/>,则将当前遍历的第条竖线段沿着向上端点的方向延长至与横线段相交的位置;djlv, jdyypztpjlv, jlh1步骤S664,当印章区域位于表格文档图像的下方位时:siI从横线段集合中筛选出距离参考竖线段的下端点最近的横线段;Lhlv0lh2如果,则将当前遍历的第条竖线段沿着向下端点的方向延长至与横线段相交的位置;jlv, jlh2如果, 则设置投影框宽度值1,取以当前遍历的第条竖线段为中心线、宽度为1、上边界线的坐标为/>、下边界线坐标为/>的矩形框,对矩形框进行水平方向投影;令投影得到的一维数组中非零元素个数和占矩形框中所有元素个数比例为,给定比例阈值,如果/>,则将当前遍历的第条竖线段沿着向下端点的方向延长至与横线段相交的位置;djlv, jdyypztpjlv, jlh2对印章区域内的横线段进行自动补齐,具体步骤为:si步骤S671,从横线段集合中筛选出其中一个端点的坐标在区域、坐标在区域/>的所有横线段,将其加入到待补齐横线段集合;对于待补齐横线段集合中的每一条当前遍历的第条横线段,其中/>,为待补齐横线段集合中的表格线的条数, 令/>表示当前遍历的第条横线段的左端点的坐标,令/>表示当前遍历的第条横线段的右端点的坐标;LhxyLshLshjlh, juLshjlh, jxjlh, jx步骤S672,参考横线段确定;当印章区域位于表格文档图像的上方位时,从印章区域的下边界线往下查找坐标大于的第一条横线段,令其为参考横线段;当印章区域位于表格文档图像的下方位时,从印章区域的上边界线往上查找坐标小于/>的第一条横线段,令其为参考横线段;令/>表示参考横线段的左端点的坐标,令/>表示参考横线段的右端点的坐标;siIsiylh0siIsiylh0lh0xlh0x步骤S673,当印章区域位于表格文档图像的右方位时:siI从竖线段集合中筛选出距离参考横线段的右端点最近的竖线段;Lvlh0lv1如果,则将当前遍历的第条横线段沿着向右端点的方向延长至与竖线段相交的位置;jlh, jlv1如果, 则设置投影框宽度值2,取以当前遍历的第条横线段为中心线、宽度为2、右边界线的坐标为/>、左边界线x坐标为/>的矩形框,对矩形框进行水平方向投影;令投影得到的一维数组中非零元素个数和占矩形框中所有元素个数比例为,给定比例阈值,如果/>,则将当前遍历的第条横线段沿着向右端点的方向延长至与竖线段相交的位置;djlh, jdxpztpjlh, jlv1步骤S674,当印章区域位于表格文档图像的左方位时:siI从竖线段集合中筛选出距离参考横线段的左端点最近的竖线段;Lvlh0lv2如果,则将当前遍历的第条横线段沿着向左端点的方向延长至与竖线段相交的位置;jlh, jlv2如果, 则设置投影框宽度值2,取以当前遍历的第条横线段为中心线、宽度为2、右边界线的坐标为/>、左边界线坐标为/>的矩形框,对矩形框进行水平方向投影;令投影得到的一维数组中非零元素个数和占矩形框中所有元素个数比例为,给定比例阈值,如果/>,则将当前遍历的第条横线段沿着向左端点的方向延长至与竖线段相交的位置。djlh, jdxxpztpjlh, jlv2