← 返回列表

用于执行计算的方法、计算装置、介质和程序产品

申请号: CN202410223942.X
申请人: 北京壁仞科技开发有限公司; 上海壁仞科技股份有限公司
申请日期: 2024/2/28

摘要文本

本发明涉及一种用于执行计算的方法、计算装置、介质和程序产品。该方法包括:计算第一矩阵乘算子的计算结果中的位置不连续的两个块计算结果,所述位置不连续的两个块计算结果分别位于第一矩阵乘算子的计算结果的不同半区的对应位置;将所述位置不连续的两个块计算结果输出至连续的寄存器中,以便形成连续的两个块计算结果;以及激活运算算子按照块的粒度,从寄存器中获取所述连续的两个块计算结果进行计算、以便生成关于第一矩阵乘和激活运算的融合算子的对应块计算结果。本发明能够在有效减少中间张量的吞吐的同时,提高执行计算的效率,进而有效地提升整个算子性能。

专利详细信息

项目 内容
专利名称 用于执行计算的方法、计算装置、介质和程序产品
专利类型 发明申请
申请号 CN202410223942.X
申请日 2024/2/28
公告号 CN117808063A
公开日 2024/4/2
IPC主分类号 G06N3/063
权利人 北京壁仞科技开发有限公司; 上海壁仞科技股份有限公司
发明人 请求不公布姓名; 请求不公布姓名; 请求不公布姓名; 请求不公布姓名
地址 北京市朝阳区望京东园四区13号楼-4至33层101内10层201室; 上海市闵行区陈行公路2388号16幢13层1302室

专利主权项内容

1.一种用于执行计算的方法,其特征在于,所述方法包括:计算第一矩阵乘算子的计算结果中的位置不连续的两个块计算结果,所述位置不连续的两个块计算结果分别位于第一矩阵乘算子的计算结果的不同半区的对应位置;将所述位置不连续的两个块计算结果输出至连续的寄存器中,以便形成连续的两个块计算结果;以及激活运算算子按照块的粒度,从寄存器中获取所述连续的两个块计算结果进行计算、以便生成关于第一矩阵乘和激活运算的融合算子的对应块计算结果。