← 返回列表

一种表格生成方法、装置、设备及存储介质

申请号: CN202410119360.7
申请人: 广州亚信技术有限公司
更新日期: 2026-03-17

专利详细信息

项目 内容
专利名称 一种表格生成方法、装置、设备及存储介质
专利类型 发明授权
申请号 CN202410119360.7
申请日 2024/1/29
公告号 CN117649675B
公开日 2024/3/29
IPC主分类号 G06V30/412
权利人 广州亚信技术有限公司
发明人 王怀照; 欧阳晔
地址 广东省广州市南沙区黄阁镇金茂中二街1号601、602、611房(仅限办公)

摘要文本

本申请公开了一种表格生成的方法、装置、设备及存储介质,涉及表格识别技术领域,该方法包括:获取表格图片数据;通过表格识别网络模型对表格图片数据进行预测,以得到预测结果,所述预测结果包括:各单元格中心点坐标、各单元格中心点偏置值、各单元格高度与宽度值、各单元格的各角点偏置值以及各单元格与相邻单元格的中心点偏置值;基于各单元格中心点坐标、各单元格中心点偏置值、各单元格高度与宽度值、各单元格的各角点偏置值以及各单元格与相邻单元格的中心点偏置值,进行目标表格的生成。从而提高了表格构建效果。

专利主权项内容

1.一种表格生成方法,其特征在于,所述方法包括:获取表格图片数据;通过表格识别网络模型对所述表格图片数据进行预测,以得到预测结果,所述预测结果包括:各单元格中心点坐标、各单元格中心点偏置值、各单元格高度与宽度值、各单元格的各角点偏置值以及各单元格与相邻单元格的中心点偏置值;基于所述各单元格中心点坐标、所述各单元格中心点偏置值、所述各单元格高度与宽度值、所述各单元格的各角点偏置值以及所述各单元格与相邻单元格的中心点偏置值,进行目标表格的生成;所述基于所述各单元格中心点坐标、所述各单元格中心点偏置值、所述各单元格高度与宽度值、所述各单元的各角点偏置值以及所述各单元格与相邻单元格的中心点偏置值,进行目标表格的生成,包括:基于所述各单元格中心点坐标以及所述各单元格中心点偏置值,确定目标表格的各单元格中心点;基于所述目标表格的各单元格中心点、所述各单元格高度与宽度值以及所述各单元格的各角点偏置值,确定目标表格的各单元格的各角点坐标;基于所述各单元格与相邻单元格的中心点偏置值,构建单元格相邻关系有向图;通过遍历所述单元格相邻关系有向图,确定各合并单元格的合并参数,并生成下向单元格链表以及至少一个右向单元格链表,所述合并单元格至少在一个方向上有至少两个相邻单元格;基于所述各合并单元格的合并参数、所述下向单元格链表、至少一个所述右向单元格链表、所述目标表格的各单元格中心点以及所述目标表格的各单元格的各角点坐标,进行所述目标表格的生成;所述通过表格识别网络模型对所述表格图片数据进行预测,包括:预处理所述表格图片数据;将预处理后的表格图片数据输入至backbone网络,以得到所述backbone网络输出的第一特征值图;将所述第一特征值图输入至FPN网络,以得到所述FPN网络输出的第二特征值图;将所述第二特征值图输入至Head网络,通过所述Head网络的中心点热力图输出所述各单元格中心点坐标,通过所述Head网络的中心点偏置回归分支输出所述各单元格中心点偏置值,通过所述Head网络的单元格宽与高回归分支输出所述各单元格高度与宽度值,通过所述Head网络的单元格角点偏置回归分支输出所述各单元格的各角点偏置值,通过所述Head网络的单元格相邻偏置回归分支输出所述各单元格与相邻单元格的中心点偏置值;所述通过遍历所述单元格相邻关系有向图,确定各合并单元格的合并参数,并生成下向单元格链表以及至少一个右向单元格链表,包括:确定所述单元格相邻关系有向图中代表根单元格的节点;确定所述单元格相邻关系有向图中代表合并单元格的节点以及合并单元格参数,以得到所述各合并单元格的合并参数;从所述代表根单元格的节点开始,通过遍历所述单元格相邻关系有向图中所述代表根单元格的节点向下的节点,生成所述下向单元格链表;从所述下向单元格链表中的根单元格开始,通过执行以下步骤直至完成所述下向单元格链表的遍历,以生成至少一个所述右向单元格链表:从代表当前遍历位置的单元格的节点开始,通过遍历所述单元格向量关系有向图中所述代表当前遍历位置的单元格的节点向右的节点,生成所述右向单元格链表。