← 返回列表
一种用于执行卷积神经网络训练的装置和方法
摘要文本
本发明提供了一种执行卷积神经网络反向训练的装置和方法,其中装置部分包括了指令存储单元、控制器单元、数据访问单元、互连模块、主运算模块、以及多个从运算模块。对于每一层来说,首先对输入神经元向量依据卷积窗口进行数据选择,然后依据选择得到的来自前一层的数据和来自后一层的数据梯度作为本装置运算单元的输入,计算并且更新卷积核,其次依据卷积核、数据的梯度以及激活函数的导函数,计算得到本装置输出的数据梯度,并且存入存储器以输出给前一层进行反向传播计算。本发明将参与计算的数据和权重参数暂存在高速暂存存储器上,使得可以更加灵活有效地支持卷积神经网络反向训练运算,提升包含大量访存应用的执行性能。。来自马克数据网
申请人信息
- 申请人:中科寒武纪科技股份有限公司
- 申请人地址:100191 北京市海淀区知春路7号致真大厦D座16层1601房
- 发明人: 中科寒武纪科技股份有限公司
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种用于执行卷积神经网络训练的装置和方法 |
| 专利类型 | 发明授权 |
| 申请号 | CN202010615117.6 |
| 申请日 | 2016年4月29日 |
| 公告号 | CN111860812B |
| 公开日 | 2024年3月1日 |
| IPC主分类号 | G06N3/063 |
| 权利人 | 中科寒武纪科技股份有限公司 |
| 发明人 | 陈云霁; 支天; 刘少礼; 郭崎; 陈天石 |
| 地址 | 北京市海淀区知春路7号致真大厦D座16层1601房 |
专利主权项内容
1.一种用于执行卷积神经网络反向训练的装置,包括控制器单元、数据访问单元、互连模块、主运算模块、多个从运算模块,其中:所述控制器单元,用于读取指令,并将该指令译码成控制互连模块、主运算模块、以及所述多个从运算模块行为的控制信号;数据访问单元用于执行从所述装置的外部地址空间与所述装置之间的数据或指令读写操作;所述从运算模块,用于根据卷积窗口,对来自前一层的输出数据进行数据选择得到当前层的输入数据,然后依据选择得到的输入数据和来自当前层的后一层的输出数据的梯度,计算并且更新卷积核;利用所述卷积核与输入数据的点积作为中间结果部分和,该卷积核与该中间结果部分和相对应;所述互连模块,用于将各从运算模块的输出的中间结果部分和拼接得到所述卷积神经网络对应层的中间结果,并传输至所述主运算模块;所述主运算模块,用于执行所述卷积神经网络每一层的计算过程中,利用每层的中间结果完成后续计算。 数据由马 克 数 据整理