← 返回列表

图像处理模型的训练方法、图像处理方法及装置

申请号: CN202311813675.3
申请人: 苏州镁伽科技有限公司
申请日期: 2023/12/27

摘要文本

本发明提供了一种图像处理模型的训练方法、图像处理方法及装置。图像处理模型包括文本检测模型和文本判断模型,文本检测模型用于对图像进行文本识别,文本判断模型用于检测图像中的文本的真实性。该方法包括:获取第一图像和对应的正样本标签;利用文本生成工具,获得第二图像以及对应的负样本标签;将第一图像和第二图像均输入到文本判断模型,以由文本判断模型输出检测结果,将第二图像输入到文本检测模型,以由文本检测模型输出文本识别结果,基于正样本标签、负样本标签、文本识别结果和检测结果,计算图像处理模型的损失值,利用损失值训练图像处理模型。该方案有效地节省了工作人员的精力,加速了模型训练的速度。

专利详细信息

项目 内容
专利名称 图像处理模型的训练方法、图像处理方法及装置
专利类型 发明申请
申请号 CN202311813675.3
申请日 2023/12/27
公告号 CN117475448A
公开日 2024/1/30
IPC主分类号 G06V30/19
权利人 苏州镁伽科技有限公司
发明人 徐海俊; 韩晓
地址 江苏省苏州市中国(江苏)自由贸易试验区苏州片区苏州工业园区东平街277号

专利主权项内容

1.一种图像处理模型的训练方法,其特征在于,所述图像处理模型包括文本检测模型和文本判断模型,所述文本检测模型用于对图像进行文本识别,所述文本判断模型用于检测图像中的文本的真实性;所述训练方法包括:步骤S110,获取第一图像和对应的正样本标签,其中,所述第一图像中包括第一文本,所述正样本标签包括所述第一文本的真实性的信息;步骤S120,利用文本生成工具,获得第二图像以及对应的负样本标签,其中,所述第二图像中包括利用所述文本生成工具所生成的第二文本,所述负样本标签包括所述第二文本的真实性的信息和文本识别信息;步骤S130,将所述第一图像和所述第二图像均输入到所述文本判断模型,以由所述文本判断模型输出检测结果,将所述第二图像输入到文本检测模型,以由所述文本识别模型输出文本识别结果,基于所述正样本标签、所述负样本标签、所述文本识别结果和所述检测结果,计算所述图像处理模型的损失值,利用所述损失值调整所述图像处理模型对应的参数,以训练所述图像处理模型。