一种GPU云计算资源管理方法、系统及存储介质
摘要文本
本发明涉及资源管理技术领域,具体公开了一种GPU云计算资源管理方法、系统及存储介质,所述方法包括获取GPU的性能参数,根据所述性能参数确定每个GPU对不同处理需求的前置权重;实时获取GPU的处理进程,根据所述处理进程确定每个GPU的空闲概率;实时监测GPU的数据交互参数,基于所述数据交互参数确定GPU的安全度;接收待处理图像,确定每个GPU的前置权重,根据前置权重、空闲概率和安全度确定每个GPU的执行概率。本发明根据各个GPU的性能参数确定权重,根据空闲情况和安全情况确定各个GPU面对当前任务的优劣,结合权重和确定的优劣共同确定各个GPU的选取概率,所述选取概率实时更新,基于选取概率分派图像,提供了一种动态的资源管理方案。
申请人信息
- 申请人:北京蓝耘科技股份有限公司
- 申请人地址:101300 北京市顺义区仁和镇林河南大街9号院9号楼4层4009室
- 发明人: 北京蓝耘科技股份有限公司
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种GPU云计算资源管理方法、系统及存储介质 |
| 专利类型 | 发明申请 |
| 申请号 | CN202410217141.2 |
| 申请日 | 2024/2/28 |
| 公告号 | CN117785491A |
| 公开日 | 2024/3/29 |
| IPC主分类号 | G06F9/50 |
| 权利人 | 北京蓝耘科技股份有限公司 |
| 发明人 | 史红星; 安江华 |
| 地址 | 北京市顺义区仁和镇林河南大街9号院9号楼4层4009室 |
专利主权项内容
1.一种GPU云计算资源管理方法,其特征在于,所述方法包括:获取GPU的性能参数,根据所述性能参数确定每个GPU对不同处理需求的前置权重;其中,所述前置权重包括两个值,分别为零和一;实时获取GPU的处理进程,根据所述处理进程确定每个GPU的空闲概率;实时监测GPU的数据交互参数,基于所述数据交互参数确定GPU的安全度;接收用户上传的含有处理需求的待处理图像,根据处理需求确定每个GPU的前置权重,根据前置权重、空闲概率和安全度确定每个GPU的执行概率;基于所述执行概率选取目标GPU,将所述待处理图像向所述目标GPU发送;所述获取GPU的性能参数,根据所述性能参数确定每个GPU对不同处理需求的前置权重的步骤包括:查询每个备案的GPU的日常占用率,根据所述日常占用率确定供给资源量;根据所述供给资源量确定额定处理需求;基于所述额定处理需求确定不同处理需求的前置权重;其中,确定规则为:不大于额定处理需求的处理需求的前置权重置为一,大于额定处理需求的处理需求置为零;统计确定好的前置权重,得到每个GPU的前置权重表;所述前置权重表包括处理需求项和前置权重项。