← 返回列表
一种云计算环境中GPU资源调度方法
摘要文本
本发明涉及GPU管理技术领域,具体公开了一种云计算环境中GPU资源调度方法,所述方法包括接收某一GPU所有方上传的含有需求时长的待处理文件,根据待处理文件计算数据处理量;查询GPU所有方的优先级,根据所述优先级、需求时长和所述数据处理量选取GPU,构建连接通道并设定监听点位;根据所述监听点位实时统计传输数据,根据传输数据计算运算收益;根据所述运算收益递归更新各个GPU所有方的优先级;本发明根据优先级、数据处理量和需求时长选取GPU并建立连接通道,基于连接通道实时获取传输数据,根据传输数据计算各个GPU产生的运算收益,基于运算收益递归更新各个GPU所有方的优先级,构建一个计算越多,优先级越高的良性循环。
申请人信息
- 申请人:北京蓝耘科技股份有限公司
- 申请人地址:101300 北京市顺义区仁和镇林河南大街9号院9号楼4层4009室
- 发明人: 北京蓝耘科技股份有限公司
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种云计算环境中GPU资源调度方法 |
| 专利类型 | 发明申请 |
| 申请号 | CN202410041170.8 |
| 申请日 | 2024/1/11 |
| 公告号 | CN117834614A |
| 公开日 | 2024/4/5 |
| IPC主分类号 | H04L67/06 |
| 权利人 | 北京蓝耘科技股份有限公司 |
| 发明人 | 安江华; 史红星 |
| 地址 | 北京市顺义区仁和镇林河南大街9号院9号楼4层4009室 |
专利主权项内容
1.一种云计算环境中GPU资源调度方法,其特征在于,所述方法包括:接收某一GPU所有方上传的含有需求时长的待处理文件,根据待处理文件计算数据处理量;查询GPU所有方的优先级,根据所述优先级、需求时长和所述数据处理量选取GPU,构建与选取的GPU之间的连接通道,并在连接通道设定至少一个监听点位;根据所述监听点位实时统计传输数据,根据传输数据计算运算收益;根据预设的时间周期定时统计各个GPU的运算收益,根据所述运算收益递归更新各个GPU所有方的优先级。