← 返回列表
用于算力调度的任务模型训练方法及算力调度方法和系统
摘要文本
本发明提供一种用于算力调度的任务模型训练方法及算力调度方法和系统,所述算力调度方法包括:获取当前待调度的任务,所述任务包括任务类型以及为所述任务的执行所申请的第一资源使用量;根据训练得到的任务模型,在不影响任务性能或在可接受的范围内的条件下,对第一资源使用量中的对任务性能影响小的资源的申请配额进行动态伸缩调整,得到为所述任务的执行所分配的资源使用量;根据所述分配的资源使用量对所述任务进行算力调度。本发明能够综合多维度资源对任务性能的影响完成自适应资源动态调度,有效提升AI算力调度中任务部署完成情况和多维度资源利用率。 来自专利查询网
申请人信息
- 申请人:中国科学院计算技术研究所
- 申请人地址:100190 北京市海淀区中关村科学院南路6号
- 发明人: 中国科学院计算技术研究所
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 用于算力调度的任务模型训练方法及算力调度方法和系统 |
| 专利类型 | 发明申请 |
| 申请号 | CN202311507154.5 |
| 申请日 | 2023/11/13 |
| 公告号 | CN117687774A |
| 公开日 | 2024/3/12 |
| IPC主分类号 | G06F9/50 |
| 权利人 | 中国科学院计算技术研究所 |
| 发明人 | 杨明烜; 洪学海 |
| 地址 | 北京市海淀区中关村科学院南路6号 |
专利主权项内容
1.一种用于算力调度的任务模型的训练方法,其特征在于,包括:以任务执行时间、任务GPU利用率、任务平均内存占用、任务CPU核数、任务类型作为训练样本;其中,所述任务GPU利用率、所述任务平均内存占用、所述任务CPU核数、所述任务类型作为任务模型的输入,所述任务执行时间为标签作为期望输出值;根据训练样本中的数据,基于梯度提升的回归树对所述任务模型进行训练;将训练后的所述任务模型作为算力调度方法中任务执行时间的预测模型。