← 返回列表
用于进行注意力运算的方法、设备和存储介质
摘要文本
本公开提供一种用于进行注意力运算的方法、设备和存储介质。其中方法包括确定查询张量的关于序列长度的第一维度的第一数值、以及关于批量大小的第二维度的第二数值;根据第一数值以及第二数值,确定目标维度;以及基于目标维度,将查询张量划分为多个第一子张量,以便多个处理器核中的每一个处理器核分别针对多个第一子张量中的一个第一子张量进行注意力计算。本公开的方案能够显著提高注意力运算的效率。
申请人信息
- 申请人:北京壁仞科技开发有限公司; 上海壁仞科技股份有限公司
- 申请人地址:100102 北京市朝阳区望京东园四区13号楼-4至33层101内10层201室
- 发明人: 北京壁仞科技开发有限公司; 上海壁仞科技股份有限公司
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 用于进行注意力运算的方法、设备和存储介质 |
| 专利类型 | 发明申请 |
| 申请号 | CN202410155290.0 |
| 申请日 | 2024/2/2 |
| 公告号 | CN117707791A |
| 公开日 | 2024/3/15 |
| IPC主分类号 | G06F9/50 |
| 权利人 | 北京壁仞科技开发有限公司; 上海壁仞科技股份有限公司 |
| 发明人 | 请求不公布姓名; 请求不公布姓名; 请求不公布姓名; 请求不公布姓名 |
| 地址 | 北京市朝阳区望京东园四区13号楼-4至33层101内10层201室; 上海市闵行区陈行公路2388号16幢13层1302室 |
专利主权项内容
1.一种用于进行注意力运算的方法,其特征在于,包括:确定查询张量的关于序列长度的第一维度的第一数值、以及关于批量大小的第二维度的第二数值;根据第一数值以及第二数值,确定目标维度;以及基于目标维度,将查询张量划分为多个第一子张量,以便多个处理器核中的每一个处理器核分别针对多个第一子张量中的一个第一子张量进行注意力计算。