← 返回列表

一种手写公式识别方法、系统、电子设备和存储介质

申请号: CN202311327693.0
申请人: 北京汉仪创新科技股份有限公司; 上海驿创信息技术有限公司
申请日期: 2023/10/13

摘要文本

本公开涉及一种手写公式识别方法、系统、电子设备和存储介质,所述方法包括如下步骤:将手写公式图像编码为特征图,对特征图中的特征向量进行二维位置编码得到位置编码,将所述位置编码与特征向量相加得到特征图像编码;使用半自回归树解码器对手写公式对应的字符布局树进行解码,得到字符布局树的字符节点间关系,并将字符节点间关系引入到解码器模型中;使用两种辅助训练任务共同参与模型训练,将辅助训练任务损失函数与解码器模型的交叉熵损失函数结合,得到解码器模型的总损失函数,使用优化器对解码器模型进行训练,得到完整的解码器模型。本公开手写公式识别方法增强了模型的泛化能力,提高了手写数学公式识别任务的准确率。

专利详细信息

项目 内容
专利名称 一种手写公式识别方法、系统、电子设备和存储介质
专利类型 发明申请
申请号 CN202311327693.0
申请日 2023/10/13
公告号 CN117373040A
公开日 2024/1/9
IPC主分类号 G06V30/244
权利人 北京汉仪创新科技股份有限公司; 上海驿创信息技术有限公司
发明人 付英男
地址 北京市海淀区翠微路2号院五区2号楼二层201; 上海市虹口区广纪路838号B幢616

专利主权项内容

1.一种手写公式识别方法,其特征在于,包括如下步骤:获取手写公式图像,并将所述手写公式图像编码为特征图,对特征图中的特征向量进行二维位置编码得到位置编码,将所述位置编码与特征向量相加得到特征图像编码;使用半自回归树解码器对手写公式对应的字符布局树进行解码,采用自回归的方式逐层预测字符布局树中的结点,采用非自回归的方式生成同一层内全部的字符结点,同时得到字符布局树的字符节点间关系,并将字符节点间关系引入到解码器模型中,通过计算得到解码器模型的交叉熵损失函数;通过构造字符布局树的全局掩码生成任务、正向生成任务和反向生成任务,计算辅助训练任务损失函数;将辅助训练任务损失函数与解码器模型的交叉熵损失函数结合,得到解码器模型的总损失函数,使用优化器对解码器模型进行训练,直到解码器模型的总损失函数收敛,得到训练完成的解码器模型。