一种用于GPU的矩阵数据处理系统
摘要文本
本申请涉及数据处理技术领域,特别是涉及一种用于GPU的矩阵数据处理系统,系统包括:GPU、数据库、处理器和存储有计算机程序的存储器,计算机程序被处理器执行时,实现以下步骤:计算得到矩阵A中各元素值与矩阵B中各元素值的元素值乘积结果,进而结合矩阵C确定参考阶数,根据参考阶数,对元素值乘积结果和矩阵C中元素的尾数进行移位后相加,得到尾数相加结果,进而确定乘积元素,根据所有乘积元素, 形成矩阵乘积结果。可知,通过限制加法器的位宽,对移位处理后的元素值乘积结果的尾数部分进行适应性舍弃,结合数据精度对模型准确率影响较小的先验信息,在相对低硬件面积的条件下,仍然能够保证人工智能模型的推理或者训练效果较好。
申请人信息
- 申请人:沐曦集成电路(上海)有限公司
- 申请人地址:201306 上海市浦东新区中国(上海)自由贸易试验区临港新片区环湖西二路888号C楼
- 发明人: 沐曦集成电路(上海)有限公司
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种用于GPU的矩阵数据处理系统 |
| 专利类型 | 发明申请 |
| 申请号 | CN202410096893.8 |
| 申请日 | 2024/1/24 |
| 公告号 | CN117632081A |
| 公开日 | 2024/3/1 |
| IPC主分类号 | G06F7/52 |
| 权利人 | 沐曦集成电路(上海)有限公司 |
| 发明人 | 张金 |
| 地址 | 上海市浦东新区中国(上海)自由贸易试验区临港新片区环湖西二路888号C楼 |
专利主权项内容
1.一种用于GPU的矩阵数据处理系统,其特征在于,所述系统包括:GPU、数据库、处理器和存储有计算机程序的存储器,其中,所述数据库中包括待进行矩阵乘积计算的矩阵A、矩阵B和矩阵C,所述矩阵A的尺寸为MK,所述矩阵B的尺寸为K/>N,所述矩阵C的尺寸为M/>N,所述GPU包括加法器和乘法器,当所述计算机程序被处理器执行时,实现以下步骤:S101,根据矩阵A和矩阵B,通过所述乘法器计算得到矩阵A中第m行第k列元素值与矩阵B中第n列第k行元素值的元素值乘积结果d,其中,m为[1, M]范围内的整数,n为[1, N]范围内的整数,k为[1, K]范围内的整数,所述元素值乘积结果d的浮点数表示包括阶数E和尾数fx;mnkmnkmnkmnkS102,根据所有元素值乘积结果以及EC,确定参考阶数E=max(E,EC),其中,EC为矩阵C中第m行第n列的元素对应的阶数;mnmaxmnkmnmnS103,根据E、EC和E,对E所对应的尾数fx以及EC所对应的尾数fc进行移位处理,得到fx对应的移位后的尾数fy和fc对应的移位后的尾数fz;mnkmnmaxmnkmnkmnmnmnkmnkmnmnS104,针对任一组m和n,使用所述加法器对fz和所有fy进行相加处理,得到尾数相加结果fu,其中,所述加法器的位宽设置为p;mnmnkmnS105,根据E和fu,确定乘积元素h;maxmnmnS106,根据所有h,形成AB+C对应的矩阵乘积结果H。mn