← 返回列表
一种用于OpenMP Offload的性能优化方法、装置及电子设备
摘要文本
本发明公开了一种OpenMP Offload的性能优化方法、装置及电子设备,该方法包括:先确定所述OpenMP Offload在异构计算时生成的核函数个数,并确定出每个核函数的特征,所述特征具体包括循环计算上界、循环计算下界、是否存在规约以及与其他核函数之间是否存在依赖关系;将所述特征输入到预设学习模型中,通过所述预设学习模型将所有核函数进行融合;最后将融合后的核函数发送至并行执行域后确定出所述融合后的核函数对应的待执行程序的程序特征,通过所述预设学习模型根据该程序特征分配线程数和线程块数。通过先减少核函数的个数,然后基于核函数对应的待执行程序的特征进行线程和线程块的动态分配,有效地提高了OpenMP Offload的性能和异构架构系统线程资源的利用率。
申请人信息
- 申请人:郑州大学
- 申请人地址:450000 河南省郑州市高新技术开发区科学大道100号
- 发明人: 郑州大学
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种用于OpenMP Offload的性能优化方法、装置及电子设备 |
| 专利类型 | 发明申请 |
| 申请号 | CN202311467813.7 |
| 申请日 | 2023/11/7 |
| 公告号 | CN117407169A |
| 公开日 | 2024/1/16 |
| IPC主分类号 | G06F9/50 |
| 权利人 | 郑州大学 |
| 发明人 | 李嘉楠; 彭绍亮; 陈梦尧; 谢景明; 聂凯 |
| 地址 | 河南省郑州市科学大道100号 |
专利主权项内容
1.一种用于OpenMP Offload的性能优化方法,其特征在于,所述方法包括:确定所述OpenMP Offload在异构计算时生成的核函数个数,并确定出每个核函数的特征,所述特征具体包括循环计算上界、循环计算下界、是否存在规约以及与其他核函数之间是否存在依赖关系;将所述特征输入到预设学习模型中,通过所述预设学习模型将所有核函数进行融合;将融合后的核函数发送至并行执行域后确定出所述融合后的核函数对应的待执行程序的程序特征,通过所述预设学习模型根据该程序特征分配线程数和线程块数。