← 返回列表
一种神经网络模型的压缩方法和相关装置
申请人信息
- 申请人:腾讯科技(深圳)有限公司
- 申请人地址:518064 广东省深圳市南山区高新区科技中一路腾讯大厦35层
- 发明人: 腾讯科技(深圳)有限公司
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种神经网络模型的压缩方法和相关装置 |
| 专利类型 | 发明申请 |
| 申请号 | CN202410031004.X |
| 申请日 | 2024/1/9 |
| 公告号 | CN117540780A |
| 公开日 | 2024/2/9 |
| IPC主分类号 | G06N3/0495 |
| 权利人 | 腾讯科技(深圳)有限公司 |
| 发明人 | 翟彬旭 |
| 地址 | 广东省深圳市南山区高新区科技中一路腾讯大厦35层 |
摘要文本
本申请公开一种神经网络模型的压缩方法和相关装置,可应用于云技术、人工智能、智慧交通、辅助驾驶等各种场景。在得到待压缩网络模型后,从待压缩网络模型的多个参数维度依次进行压缩。在压缩过程中,第i+1次压缩为从待压缩网络模型的第i+1个参数维度对第i个模型进行压缩,得到第i+1个模型,i=0、1、2、……、n‑1,n为多个参数维度的数量,n为大于1的正整数;当i=0时,第i个模型是待压缩网络模型,当i大于0时,第i个模型是从待压缩网络模型的第i个参数维度进行压缩得到的。在完成从第n个参数维度对第n‑1个模型进行压缩后,基于第n次压缩得到的第n个模型确定压缩后的网络模型。由此提高模型压缩率和应用效果。
专利主权项内容
1.一种神经网络模型的压缩方法,其特征在于,所述方法包括:获取待压缩网络模型;对所述待压缩网络模型,从所述待压缩网络模型的多个参数维度依次进行压缩;在对所述待压缩网络模型,从所述待压缩网络模型的多个参数维度依次进行压缩的过程中,第i+1次压缩为从所述待压缩网络模型的第i+1个参数维度对第i个模型进行压缩,得到第i+1个模型,i=0、1、2、……、n-1,n为所述多个参数维度的数量,n为大于1的正整数;当i=0时,所述第i个模型是所述待压缩网络模型,当i大于0时,所述第i个模型是从所述待压缩网络模型的第i个参数维度进行压缩得到的;在完成从所述待压缩网络模型的第n个参数维度对第n-1个模型进行压缩后,基于第n次压缩得到的第n个模型确定压缩后的网络模型。。() (来 自 马 克 数 据 网)