← 返回列表

一种监控服务器功耗负载的智能调度方法及系统

申请号: CN202311739181.5
申请人: 武汉泽塔云科技股份有限公司
申请日期: 2023/12/18

摘要文本

本发明涉及一种监控服务器功耗负载的智能调度方法及系统,其方法包括获取被监控集群中所有服务器的使用参数信息并构建使用参数样本集;构建多层训练算法模型并进行训练,得到超负荷信息;根据超负荷信息对超负荷服务器的任务节点进行初次提前调度处理;在经过初次提前调度处理后超负荷服务器的功耗继续增加且增幅超过预设增幅阈值时,按照任务节点的预设重要等级、采用预设调度机制对服务器的任务节点进行热迁移或锁定处理。本发明实现了对服务器功耗负载的动态实时监控和自动调度,结合调度模型和算法实现了云平台的绝对安全,避免因为功耗过高等导致的宕机风险,无需人工操作,并且调度不影响用户作业,同时提高了服务器的利用率。 来自马克数据网

专利详细信息

项目 内容
专利名称 一种监控服务器功耗负载的智能调度方法及系统
专利类型 发明授权
申请号 CN202311739181.5
申请日 2023/12/18
公告号 CN117421131B
公开日 2024/3/26
IPC主分类号 G06F9/50
权利人 武汉泽塔云科技股份有限公司
发明人 王卓
地址 湖北省武汉市汉阳区梅林东路19号华发四季二期写字楼14层(1)号

专利主权项内容

1.一种监控服务器功耗负载的智能调度方法, 其特征在于,包括如下步骤:获取被监控集群中所有服务器的使用参数信息,并与对应预设使用参数阈值进行比较,构建包含比较结果的使用参数样本集;构建多层训练算法模型,并将所述使用参数样本集输入至所述多层训练算法模型进行训练,得到包含被监控集群中所有服务器在未来时间段超过对应预设功耗阈值的超负荷信息;根据所述超负荷信息对超过对应预设功耗阈值的超负荷服务器的任务节点进行初次提前调度处理;在经过所述初次提前调度处理后存在所述超负荷服务器的功耗继续增加且增幅超过预设增幅阈值时,按照任务节点的预设重要等级、采用预设调度机制对服务器的任务节点进行热迁移或锁定处理,并在所述超负荷服务器的实时功耗回落至对应预设功耗阈值范围内时恢复热迁移或解除锁定;所述将所述使用参数样本集输入至所述多层训练算法模型进行训练,得到包含被监控集群中所有服务器在未来时间段超过对应预设功耗阈值的超负荷信息具体包括如下步骤:将所述使用参数样本集中的使用参数信息和对应的比较结果作为所述多层训练算法模型的第一层输入,根据预设激活函数()的收敛值确定服务器的初步功耗值,计算公式为:zx
;其中,分别对应时间段的CPU使用率峰值、内存使用率峰值、磁盘使用率峰值和服务进程等待数峰值,/>分别为对应时间段的实时功耗;将所述初步功耗值作为所述多层训练算法模型的第二层输入,根据所述预设激活函数()进行计算,并根据所述预设激活函数的收敛值确定服务器的功耗峰值,计算公式为:;zx其中,、、、分别为服务器在时间段、、、对应的初步功耗峰值; 将所述功耗峰值与根据所述预设功耗阈值进行比较,并在所述功耗峰值大于所述预设功耗阈值时,根据所述功耗峰值以及超过对应预设功耗阈值的未来时间段生成所述超负荷信息;a0a1a2a3θ0θ1θ2θ3所述按照任务节点的预设重要等级、采用预设调度机制对服务器的任务节点进行热迁移或锁定处理具体包括如下步骤:将所述超负荷服务器中重要等级为一般的所述任务节点热迁移至未超过对应预设功耗阈值的轻负荷服务器中当前功耗最低的任务节点,并监测所述超负荷服务器的实时功耗;若所述超负荷服务器的实时功耗降低至对应的预设功耗阈值范围内,则停止热迁移,否则,将所述超负荷服务器中重要等级为重要的所述任务节点热迁移至所述轻负荷服务器中当前功耗最低的任务节点,并继续监测所述超负荷服务器的实时功耗;若所述超负荷服务器的实时功耗降低至对应的预设功耗阈值范围内,则停止热迁移,否则将所述超负荷服务器中重要等级为非常重要的所述任务节点的GPU频率按照对应的实时功耗从高至低逐个进行锁定,直至所述超负荷服务器的实时功耗降低至对应的预设功耗阈值范围;所述预设重要等级至少包括非常重要、重要和一般重要。