← 返回列表

一种适用于数据中心水冷系统的节能预测控制方法

申请号: CN202311724478.4
申请人: 南京群顶科技股份有限公司
更新日期: 2026-03-09

专利详细信息

项目 内容
专利名称 一种适用于数据中心水冷系统的节能预测控制方法
专利类型 发明授权
申请号 CN202311724478.4
申请日 2023/12/15
公告号 CN117408170B
公开日 2024/3/8
IPC主分类号 G06F30/27
权利人 南京群顶科技股份有限公司
发明人 杨鹏; 戴伟
地址 江苏省南京市建邺区奥体大街68号南京新城科技园国际研发总部园1幢8层

摘要文本

本发明公开了一种适用于数据中心水冷系统的节能预测控制方法,获取历史数据中心的环境信息数据;将环境信息数据转化为元组形式,并进行预测神经网络训练;采集当前数据中心的室内外环境信息转化为元组形式,通过预测神经网络进行水冷机组未来冷量预测;用马尔可夫决策过程来表述水冷机组的冷量设定,通过状态空间、动作空间和约束条件来确定奖励函数和状态‑动作值函数;基于状态‑动作值函数,水冷机组获得的预测冷量以及环境信息数据,通过训练后Actor‑Critic神经网络,输出水冷机组的调控策略。本发明利用深度强化学习方法并基于外界环境因素对未来需求冷量进行预测,预先设定制水冷机组系统的控制策略,保证数据中心的设备安全稳定。 关注公众号专利查询网

专利主权项内容

马-克-数据 1.一种适用于数据中心水冷系统的节能预测控制方法,其特征在于,所述节能预测控制方法包括以下步骤:步骤1,从数据库中获取历史数据中心的水冷机组冷量数据以及水冷机组运行的环境信息数据;步骤2,将环境信息数据转化为元组形式,并将转化后的元组形式输入到预测神经网络中进行训练,将环境信息数据转化为符合分析的元组形式:
,其中,表示数据中心室内温度,/>表示数据中心室外温度,/>表示数据中心室内湿度,/>表示数据中心室外湿度,/>表示数据中心室内风速,/>表示数据中心室外风速,/>表示数据中心室内气压,/>表示数据中心室外气压,/>表示时间序,/>时刻冷量值/>,/>时刻冷量值/>,将/>时刻冷量值/>作为预测神经网络每组训练的目标,表示为当/>时刻的数据中心室内外环境状况下,/>时刻数据中心冷量的需求量;步骤3,采集当前数据中心的室内外环境信息,并将当前数据中心的室内外环境信息转化为步骤2中的元组形式,输入到训练好的预测神经网络中进行水冷机组未来冷量预测;步骤4,建立水冷机组控制模型,设置水冷机组系统控制的目标函数为当前水冷机组能耗最低,约束条件为水冷机组产生的冷量满足数据中心运行以及水冷机组运行;步骤5,水冷机组系统控制使用马尔可夫决策过程进行建模,用马尔可夫决策过程来表述水冷机组的冷量设定,确定水冷机组能耗优化模型的状态空间和动作空间,并且通过状态空间、动作空间和约束条件来确定奖励函数和状态-动作值函数,包括以下内容:步骤5.1,确定状态空间,在水冷机组系统控制中,智能体从环境中获取环境信息数据;步骤5.2,确定动作空间,在水冷机组系统控制中,智能体的动作空间包含风机转速调节、水冷机组的负荷率调节以及水泵频率调节;步骤5.3,设置奖励函数,奖励函数代表了在某一个状态下,智能体采用指定的动作时,环境反馈给智能体的及时收益,为了使得整个水冷机组在整个调度周期内的能耗最小,奖励函数设置为:
式中,/>表示/>时刻的水冷机组的总能耗,/>为惩罚因子;步骤5.4,设置状态-动作函数,表征策略/>的优劣程度,即在策略/>下奖励函数的回报:
式中,智能体的策略/>为状态空间/>到动作空间/>的映射,表示取值为[0, 1]的折扣因子,/>表示当前数据中心室内外的环境状态,/>表示Actor网络动作,/>表示水冷机组优化运行时间窗内共有/>个时刻,最优策略/>为状态-动作函数的最大,即奖励函数的累积回报最大:
;步骤6,基于状态-动作值函数,水冷机组获得的预测冷量以及环境信息数据,进行基于TD3算法的Actor-Critic神经网络训练,通过训练后Actor-Critic神经网络,输出水冷机组的调控策略,包括以下步骤:步骤6.1,初始化Actor网络、Critic网络、目标Critic网络、目标Actor网络参数和经验缓冲池参数;步骤6.2,对于每一幕的每个实践部执行如下的步骤:步骤6.21,获取当前数据中心室内外的环境状态,并且获取预测神经网络分析输出数据中心未来时间段所需冷量,通过Actor网络得到Actor网络动作/>;步骤6.22,在Actor网络动作中引入随机噪声n得到随机动作/>;步骤6.23,执行随机动作,获取奖励函数值和下一时刻数据中心室内外的环境状态;步骤6.24,将存储到经验放回池;步骤6.25,从经验回放池中随机抽取经验样本;步骤6.26,基于经验样本通过目标Actor网络获得下一时刻Actor网络动作;步骤6.27,在下一时刻动作中引入随机噪声n得到随机动作;步骤6.28,通过2个目标Critic网络的最小值和贝尔曼方程,获取目标Critic函数:
其中/>为第i个目标Critic网络的取值;步骤6.29,通过目标Critic函数与Critic网络计算出的当前Critic函数的均方差来计算Critic网络损失函数,根据Critic网络损失函数关于Critic网络的梯度更新Critic网络;通过总奖励值与Actor网络概率的乘积计算Actor网络损失函数,根据Actor网络损失函数关于Actor网络的梯度参数更新,输出训练好的Actor-Critic神经网络;步骤6.3,将训练好的Actor-Critic神经网络程序部署在控制终端,并在控制终端使用传感器获取数据中心室内外的环境状态变量,获取预测神经网络中的预测冷量值,将环境状态变量以及预测冷量值输入到Actor网络中,得到输出的水冷机组的风机转速、水冷机组的部分负荷率、水泵频率控制值,实现水冷机组的调控。