← 返回列表

一种可减少汉字识别资源开销的卷积自编码器构建方法

申请号: CN202311455684.X
申请人: 四川轻化工大学
更新日期: 2026-03-09

专利详细信息

项目 内容
专利名称 一种可减少汉字识别资源开销的卷积自编码器构建方法
专利类型 发明申请
申请号 CN202311455684.X
申请日 2023/11/2
公告号 CN117496531A
公开日 2024/2/2
IPC主分类号 G06V30/19
权利人 四川轻化工大学
发明人 何小利; 张博; 龙源; 宋钰
地址 四川省自贡市自流井区汇东学苑街180号

摘要文本

四川轻化工大学取得“一种透气窗帘布”专利技术,本发明提供一种可减少汉字识别资源开销的卷积自编码器构建方法,属于人工智能及计算机视觉技术领域,解决了传统方法资源开销上的局限性问题;包括:使用双线性插值法增强图像数据,使用K均值聚类算法将图像数据中的关键特征进行聚类提取;建立层级数据库,单独存储具有不同关键特征的图像数据;结合卷积自编码器的输入与输出特征,构建出自定义损失函数和交叉熵损失函数;结合层级数据库中不同关键特征的图像数据,通过搭建卷积层、池化层和全连接层的方式,构建出卷积自编码器,作为汉字识别模型的核心结构;本发明相较于传统模型,具有更加精简的结构、更好的识别精度与识别速度,顺利实现了较少资源对中文汉字字符的模型训练。

专利主权项内容

1.一种可减少汉字识别资源开销的卷积自编码器构建方法,其特征在于,所述方法包括如下步骤:S1、获取数据集并预处理,使用双线性插值法,对数据集中的图像数据进行增强;S2、提取增强后图像数据的关键特征,使用K均值聚类算法,将关键特征相符的所有图像数据聚类,搭建出层级数据库;层级数据库中,单独构建数据表,存储具有不同关键特征的图像数据;S3、依据拟构建汉字识别模型的复杂性与融合性,结合卷积自编码器的输入与输出特征,构建出自定义损失函数和交叉熵损失函数,同时确定出卷积自编码器的综合评价指标;S4、依据卷积自编码器的结构标准,结合层级数据库中不同关键特征的图像数据,通过搭建卷积层、池化层和全连接层的方式,构建出卷积自编码器,作为汉字识别模型的核心结构。