← 返回列表

一种云计算环境中GPU资源调度方法

申请号: CN202410041170.8
申请人: 北京蓝耘科技股份有限公司
申请日期: 2024/1/11

摘要文本

本发明涉及GPU管理技术领域,具体公开了一种云计算环境中GPU资源调度方法,所述方法包括接收某一GPU所有方上传的含有需求时长的待处理文件,根据待处理文件计算数据处理量;查询GPU所有方的优先级,根据所述优先级、需求时长和所述数据处理量选取GPU,构建连接通道并设定监听点位;根据所述监听点位实时统计传输数据,根据传输数据计算运算收益;根据所述运算收益递归更新各个GPU所有方的优先级;本发明根据优先级、数据处理量和需求时长选取GPU并建立连接通道,基于连接通道实时获取传输数据,根据传输数据计算各个GPU产生的运算收益,基于运算收益递归更新各个GPU所有方的优先级,构建一个计算越多,优先级越高的良性循环。

专利详细信息

项目 内容
专利名称 一种云计算环境中GPU资源调度方法
专利类型 发明申请
申请号 CN202410041170.8
申请日 2024/1/11
公告号 CN117834614A
公开日 2024/4/5
IPC主分类号 H04L67/06
权利人 北京蓝耘科技股份有限公司
发明人 安江华; 史红星
地址 北京市顺义区仁和镇林河南大街9号院9号楼4层4009室

专利主权项内容

1.一种云计算环境中GPU资源调度方法,其特征在于,所述方法包括:接收某一GPU所有方上传的含有需求时长的待处理文件,根据待处理文件计算数据处理量;查询GPU所有方的优先级,根据所述优先级、需求时长和所述数据处理量选取GPU,构建与选取的GPU之间的连接通道,并在连接通道设定至少一个监听点位;根据所述监听点位实时统计传输数据,根据传输数据计算运算收益;根据预设的时间周期定时统计各个GPU的运算收益,根据所述运算收益递归更新各个GPU所有方的优先级。