← 返回列表

一种GPU云计算资源管理方法、系统及存储介质

申请号: CN202410217141.2
申请人: 北京蓝耘科技股份有限公司
申请日期: 2024/2/28

摘要文本

本发明涉及资源管理技术领域,具体公开了一种GPU云计算资源管理方法、系统及存储介质,所述方法包括获取GPU的性能参数,根据所述性能参数确定每个GPU对不同处理需求的前置权重;实时获取GPU的处理进程,根据所述处理进程确定每个GPU的空闲概率;实时监测GPU的数据交互参数,基于所述数据交互参数确定GPU的安全度;接收待处理图像,确定每个GPU的前置权重,根据前置权重、空闲概率和安全度确定每个GPU的执行概率。本发明根据各个GPU的性能参数确定权重,根据空闲情况和安全情况确定各个GPU面对当前任务的优劣,结合权重和确定的优劣共同确定各个GPU的选取概率,所述选取概率实时更新,基于选取概率分派图像,提供了一种动态的资源管理方案。

专利详细信息

项目 内容
专利名称 一种GPU云计算资源管理方法、系统及存储介质
专利类型 发明申请
申请号 CN202410217141.2
申请日 2024/2/28
公告号 CN117785491A
公开日 2024/3/29
IPC主分类号 G06F9/50
权利人 北京蓝耘科技股份有限公司
发明人 史红星; 安江华
地址 北京市顺义区仁和镇林河南大街9号院9号楼4层4009室

专利主权项内容

1.一种GPU云计算资源管理方法,其特征在于,所述方法包括:获取GPU的性能参数,根据所述性能参数确定每个GPU对不同处理需求的前置权重;其中,所述前置权重包括两个值,分别为零和一;实时获取GPU的处理进程,根据所述处理进程确定每个GPU的空闲概率;实时监测GPU的数据交互参数,基于所述数据交互参数确定GPU的安全度;接收用户上传的含有处理需求的待处理图像,根据处理需求确定每个GPU的前置权重,根据前置权重、空闲概率和安全度确定每个GPU的执行概率;基于所述执行概率选取目标GPU,将所述待处理图像向所述目标GPU发送;所述获取GPU的性能参数,根据所述性能参数确定每个GPU对不同处理需求的前置权重的步骤包括:查询每个备案的GPU的日常占用率,根据所述日常占用率确定供给资源量;根据所述供给资源量确定额定处理需求;基于所述额定处理需求确定不同处理需求的前置权重;其中,确定规则为:不大于额定处理需求的处理需求的前置权重置为一,大于额定处理需求的处理需求置为零;统计确定好的前置权重,得到每个GPU的前置权重表;所述前置权重表包括处理需求项和前置权重项。