← 返回列表

文本识别方法、装置、电子设备及可读存储介质

申请号: CN202410131516.3
申请人: 苏州元脑智能科技有限公司
更新日期: 2026-03-20

专利详细信息

项目 内容
专利名称 文本识别方法、装置、电子设备及可读存储介质
专利类型 发明申请
申请号 CN202410131516.3
申请日 2024/1/31
公告号 CN117668563A
公开日 2024/3/8
IPC主分类号 G06F18/214
权利人 苏州元脑智能科技有限公司
发明人 李兵兵; 王彦伟; 朱克峰; 黄伟; 李仁刚
地址 江苏省苏州市吴中经济开发区郭巷街道官浦路1号9幢

摘要文本

本发明公开了一种文本识别方法、装置、电子设备及可读存储介质,应用于计算机视觉技术领域。其中,方法包括获取经过预训练过程处理的文本类型识别模型,根据其模型结构特点确定能够自动选择微调过程中的待调整参数的参数选择网络。根据文本数据训练样本集的各文本样本的预测值和对应的文本类型标签、文本类型识别模型在训练过程中的稀疏度损失得到损失函数,并结合文本数据训练样本集及文本识别任务对文本类型识别模型的各待更新参数进行微调,从而得到能够对输入的待处理文本进行文本类型识别的文本类型识别模型。本发明可以解决相关技术对文本类型识别模型进行微调时有效性和灵活性差的问题,能够提升文本类型识别精准度和识别效率。

专利主权项内容

1.一种文本识别方法,其特征在于,包括:获取经过预训练过程处理的文本类型识别模型,并获取携带文本类型标签的文本数据训练样本集;根据所述文本类型识别模型的模型结构特点确定参数选择网络;所述模型结构特点用于确定所述文本类型识别模型的待更新参数对应的最小模型结构单位,所述参数选择网络用于自动选择所述文本类型识别模型在微调过程中进行重新调整的待更新参数;根据所述文本类型识别模型对所述文本数据训练样本集的各文本样本的预测值和对应的文本类型标签、所述文本类型识别模型在训练过程中的稀疏度损失,共同确定损失函数;其中,所述稀疏度损失用于控制所述待更新参数的总个数;利用所述文本数据训练样本集,基于文本识别任务和所述损失函数,对所述文本类型识别模型的各待更新参数进行调整;利用调整后的所述文本类型识别模型,对输入的待处理文本进行文本类型识别,得到相应的文本类型识别结果。。