← 返回列表
一种手写公式识别方法、系统、电子设备和存储介质
摘要文本
本公开涉及一种手写公式识别方法、系统、电子设备和存储介质,所述方法包括如下步骤:将手写公式图像编码为特征图,对特征图中的特征向量进行二维位置编码得到位置编码,将所述位置编码与特征向量相加得到特征图像编码;使用半自回归树解码器对手写公式对应的字符布局树进行解码,得到字符布局树的字符节点间关系,并将字符节点间关系引入到解码器模型中;使用两种辅助训练任务共同参与模型训练,将辅助训练任务损失函数与解码器模型的交叉熵损失函数结合,得到解码器模型的总损失函数,使用优化器对解码器模型进行训练,得到完整的解码器模型。本公开手写公式识别方法增强了模型的泛化能力,提高了手写数学公式识别任务的准确率。
申请人信息
- 申请人:北京汉仪创新科技股份有限公司; 上海驿创信息技术有限公司
- 申请人地址:100089 北京市海淀区翠微路2号院五区2号楼二层201
- 发明人: 北京汉仪创新科技股份有限公司; 上海驿创信息技术有限公司
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种手写公式识别方法、系统、电子设备和存储介质 |
| 专利类型 | 发明申请 |
| 申请号 | CN202311327693.0 |
| 申请日 | 2023/10/13 |
| 公告号 | CN117373040A |
| 公开日 | 2024/1/9 |
| IPC主分类号 | G06V30/244 |
| 权利人 | 北京汉仪创新科技股份有限公司; 上海驿创信息技术有限公司 |
| 发明人 | 付英男 |
| 地址 | 北京市海淀区翠微路2号院五区2号楼二层201; 上海市虹口区广纪路838号B幢616 |
专利主权项内容
1.一种手写公式识别方法,其特征在于,包括如下步骤:获取手写公式图像,并将所述手写公式图像编码为特征图,对特征图中的特征向量进行二维位置编码得到位置编码,将所述位置编码与特征向量相加得到特征图像编码;使用半自回归树解码器对手写公式对应的字符布局树进行解码,采用自回归的方式逐层预测字符布局树中的结点,采用非自回归的方式生成同一层内全部的字符结点,同时得到字符布局树的字符节点间关系,并将字符节点间关系引入到解码器模型中,通过计算得到解码器模型的交叉熵损失函数;通过构造字符布局树的全局掩码生成任务、正向生成任务和反向生成任务,计算辅助训练任务损失函数;将辅助训练任务损失函数与解码器模型的交叉熵损失函数结合,得到解码器模型的总损失函数,使用优化器对解码器模型进行训练,直到解码器模型的总损失函数收敛,得到训练完成的解码器模型。