← 返回列表

一种基于码表聚类的深度学习模型压缩方法

申请号: CN202311590503.4
申请人: 浙江大学
申请日期: 2023/11/27

摘要文本

本发明提供了一种基于码表聚类的深度学习模型压缩方法,属于深度学习中的模型压缩领域。方法包括对模型权重使用码表聚类算法获得码表和索引并重构出压缩后的权重。本发明利用深度学习模型权重向量的重复性,基于码表聚类算法,获得低内存占用的码表和索引,实现极高的模型压缩率,降低模型存储的内存占用并保持良好的模型性能。

专利详细信息

项目 内容
专利名称 一种基于码表聚类的深度学习模型压缩方法
专利类型 发明申请
申请号 CN202311590503.4
申请日 2023/11/27
公告号 CN117639792A
公开日 2024/3/1
IPC主分类号 H03M7/42
权利人 浙江大学
发明人 黄科杰; 邓军灿; 沈海斌
地址 浙江省杭州市西湖区余杭塘路866号

专利主权项内容

1.一种基于码表聚类的深度学习模型压缩方法,其特征在于,包括如下步骤:步骤S1:提取深度学习模型中线性层和卷积层的权重,将这些权重按输入通道方向切分,从而获得一系列权重向量;切分得到的权重向量的长度定义为V;步骤S2:针对各个权重分别设置码表,码表尺寸为K*V,K为码表中码字的数量,使用码表聚类算法进行权重向量聚类,得到最终更新后的码表,权重向量聚类过程中每个权重向量分配得到索引,分配的索引为与该权重向量距离最短的码字在码表中的位置;步骤S3:保存聚类完成的码表和索引以及原始深度学习模型中其他没有被压缩的数据,作为压缩后的模型;当运行压缩后的模型时,针对各个权重,使用其权重向量对应的索引去检索对应的码字,利用这些码字重构出与原始的权重尺寸相同的压缩后权重。