← 返回列表
计算图序列化方法、装置和存储介质
摘要文本
本公开涉及一种计算图序列化方法、装置和存储介质。该方法包括:第一处理器获取目标模型的计算图;第一处理器确定计算图中的计算子图;第一处理器基于计算子图生成目标计算序列,目标计算序列为计算图对应的计算序列中,在第二处理器上执行时占用第二处理器内存最小的计算序列,目标计算序列用于在第二处理器上执行,以实现基于目标模型的推理。根据本申请实施例,可以考虑到软硬件协同进行计算图序列化,搜索内存最小的计算序列,可以节省硬件资源并提升目标模型在第二处理器上的推理速度。 来源:百度马 克 数据网
申请人信息
- 申请人:摩尔线程智能科技(北京)有限责任公司
- 申请人地址:100080 北京市海淀区翠微中里14号楼四层B655
- 发明人: 摩尔线程智能科技(北京)有限责任公司
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 计算图序列化方法、装置和存储介质 |
| 专利类型 | 发明申请 |
| 申请号 | CN202311551613.X |
| 申请日 | 2023/11/20 |
| 公告号 | CN117540808A |
| 公开日 | 2024/2/9 |
| IPC主分类号 | G06N5/04 |
| 权利人 | 摩尔线程智能科技(北京)有限责任公司 |
| 发明人 | 请求不公布姓名 |
| 地址 | 北京市海淀区翠微中里14号楼四层B655 |
专利主权项内容
1.一种计算图序列化方法,其特征在于,所述方法包括:第一处理器获取目标模型的计算图;所述第一处理器确定所述计算图中的计算子图;所述第一处理器基于所述计算子图生成目标计算序列,所述目标计算序列为计算图对应的计算序列中,在第二处理器上执行时占用所述第二处理器内存最小的计算序列,所述目标计算序列用于在所述第二处理器上执行,以实现基于所述目标模型的推理。