← 返回列表
模型量化方法、装置、电子设备及存储介质
摘要文本
本申请公开一种模型量化方法,包括:获取当前网络层的权重矩阵,对权重矩阵进行划块得到多个权重块;对多个权重块内的权重绝对值按列排序重组得到多个目标权重块;根据每个目标权重块的量化偏差和量化阈值确定每个目标权重块的量化精度;根据多个目标权重块在量化前后的权重分布偏差和分布阈值对量化阈值进行调节以获取多个目标权重块的目标量化精度;根据多个目标权重块的目标量化精度对多个目标权重块进行量化得到多个量化权重块;采用按位交错的映射方式将多个量化权重块映射到多个交叉阵列单元上。本申请还提供一种模型量化装置、电子设备及存储介质,可以灵活选择权重的位宽,在保证压缩效率的同时减少精度损失。
申请人信息
- 申请人:苏州亿铸智能科技有限公司; 上海交通大学
- 申请人地址:215011 江苏省苏州市高新区塔园路101号佳兆业悦峰大厦1幢1911室
- 发明人: 苏州亿铸智能科技有限公司; 上海交通大学
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 模型量化方法、装置、电子设备及存储介质 |
| 专利类型 | 发明申请 |
| 申请号 | CN202311552181.4 |
| 申请日 | 2023/11/21 |
| 公告号 | CN117574966A |
| 公开日 | 2024/2/20 |
| IPC主分类号 | G06N3/0464 |
| 权利人 | 苏州亿铸智能科技有限公司; 上海交通大学 |
| 发明人 | 蒋力; 刘方鑫; 杨宁; 宋芝妍; 熊大鹏; 李涛 |
| 地址 | 江苏省苏州市高新区塔园路101号佳兆业悦峰大厦1幢1911室; 上海市闵行区东川路800号 |
专利主权项内容
1.一种模型量化方法,其特征在于,包括:获取当前网络层的权重矩阵,对权重矩阵进行划块得到多个权重块;对多个权重块内的权重绝对值按列排序重组得到多个目标权重块;根据每个目标权重块的量化偏差和量化阈值确定每个目标权重块的量化精度;根据多个目标权重块在量化前后的权重分布偏差和分布阈值对量化阈值进行调节以获取多个目标权重块的目标量化精度;根据多个目标权重块的目标量化精度对多个目标权重块进行量化得到多个量化权重块;采用按位交错的映射方式将多个量化权重块映射到多个交叉阵列单元上。