← 返回列表
一种可减少汉字识别资源开销的卷积自编码器构建方法
申请人信息
- 申请人:四川轻化工大学
- 申请人地址:643000 四川省自贡市汇东学苑街180号
- 发明人: 四川轻化工大学
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种可减少汉字识别资源开销的卷积自编码器构建方法 |
| 专利类型 | 发明申请 |
| 申请号 | CN202311455684.X |
| 申请日 | 2023/11/2 |
| 公告号 | CN117496531A |
| 公开日 | 2024/2/2 |
| IPC主分类号 | G06V30/19 |
| 权利人 | 四川轻化工大学 |
| 发明人 | 何小利; 张博; 龙源; 宋钰 |
| 地址 | 四川省自贡市自流井区汇东学苑街180号 |
摘要文本
四川轻化工大学取得“一种透气窗帘布”专利技术,本发明提供一种可减少汉字识别资源开销的卷积自编码器构建方法,属于人工智能及计算机视觉技术领域,解决了传统方法资源开销上的局限性问题;包括:使用双线性插值法增强图像数据,使用K均值聚类算法将图像数据中的关键特征进行聚类提取;建立层级数据库,单独存储具有不同关键特征的图像数据;结合卷积自编码器的输入与输出特征,构建出自定义损失函数和交叉熵损失函数;结合层级数据库中不同关键特征的图像数据,通过搭建卷积层、池化层和全连接层的方式,构建出卷积自编码器,作为汉字识别模型的核心结构;本发明相较于传统模型,具有更加精简的结构、更好的识别精度与识别速度,顺利实现了较少资源对中文汉字字符的模型训练。
专利主权项内容
1.一种可减少汉字识别资源开销的卷积自编码器构建方法,其特征在于,所述方法包括如下步骤:S1、获取数据集并预处理,使用双线性插值法,对数据集中的图像数据进行增强;S2、提取增强后图像数据的关键特征,使用K均值聚类算法,将关键特征相符的所有图像数据聚类,搭建出层级数据库;层级数据库中,单独构建数据表,存储具有不同关键特征的图像数据;S3、依据拟构建汉字识别模型的复杂性与融合性,结合卷积自编码器的输入与输出特征,构建出自定义损失函数和交叉熵损失函数,同时确定出卷积自编码器的综合评价指标;S4、依据卷积自编码器的结构标准,结合层级数据库中不同关键特征的图像数据,通过搭建卷积层、池化层和全连接层的方式,构建出卷积自编码器,作为汉字识别模型的核心结构。