← 返回列表

一种神经网络模型的压缩方法和相关装置

申请号: CN202410031004.X
申请人: 腾讯科技(深圳)有限公司
更新日期: 2026-03-17

专利详细信息

项目 内容
专利名称 一种神经网络模型的压缩方法和相关装置
专利类型 发明申请
申请号 CN202410031004.X
申请日 2024/1/9
公告号 CN117540780A
公开日 2024/2/9
IPC主分类号 G06N3/0495
权利人 腾讯科技(深圳)有限公司
发明人 翟彬旭
地址 广东省深圳市南山区高新区科技中一路腾讯大厦35层

摘要文本

本申请公开一种神经网络模型的压缩方法和相关装置,可应用于云技术、人工智能、智慧交通、辅助驾驶等各种场景。在得到待压缩网络模型后,从待压缩网络模型的多个参数维度依次进行压缩。在压缩过程中,第i+1次压缩为从待压缩网络模型的第i+1个参数维度对第i个模型进行压缩,得到第i+1个模型,i=0、1、2、……、n‑1,n为多个参数维度的数量,n为大于1的正整数;当i=0时,第i个模型是待压缩网络模型,当i大于0时,第i个模型是从待压缩网络模型的第i个参数维度进行压缩得到的。在完成从第n个参数维度对第n‑1个模型进行压缩后,基于第n次压缩得到的第n个模型确定压缩后的网络模型。由此提高模型压缩率和应用效果。

专利主权项内容

1.一种神经网络模型的压缩方法,其特征在于,所述方法包括:获取待压缩网络模型;对所述待压缩网络模型,从所述待压缩网络模型的多个参数维度依次进行压缩;在对所述待压缩网络模型,从所述待压缩网络模型的多个参数维度依次进行压缩的过程中,第i+1次压缩为从所述待压缩网络模型的第i+1个参数维度对第i个模型进行压缩,得到第i+1个模型,i=0、1、2、……、n-1,n为所述多个参数维度的数量,n为大于1的正整数;当i=0时,所述第i个模型是所述待压缩网络模型,当i大于0时,所述第i个模型是从所述待压缩网络模型的第i个参数维度进行压缩得到的;在完成从所述待压缩网络模型的第n个参数维度对第n-1个模型进行压缩后,基于第n次压缩得到的第n个模型确定压缩后的网络模型。。() (来 自 马 克 数 据 网)