← 返回列表

海洋平台通风系统分层优化控制方法

申请号: CN202311790669.0
申请人: 中国海洋大学
更新日期: 2026-03-09

专利详细信息

项目 内容
专利名称 海洋平台通风系统分层优化控制方法
专利类型 发明授权
申请号 CN202311790669.0
申请日 2023/12/25
公告号 CN117450637B
公开日 2024/3/19
IPC主分类号 F24F11/64
权利人 中国海洋大学
发明人 崔璨; 薛佳慧; 付艺聪; 吴森源
地址 山东省青岛市崂山区松岭路238号

摘要文本

本发明属于海洋工程技术领域,提供一种海洋平台通风系统分层优化控制方法。定义每个舱室风阀为一个智能体;确定海洋平台通风系统的控制目标,并设计智能体强化学习要素;根据设定得海洋平台通风系统控制目标、强化学习要素;基于SAC算法,对舱室风阀智能体进行训练,获得海洋平台通风系统各舱室的需求风量;基于舱室通风量控制目标,对海洋平台通风系统风量进行比例平衡控制,控制所有舱室的实际风量与需求风量的比例误差最小,求解获得需求风量比例一致的最优舱室风阀角度;根据比例平衡控制的求解结果,进行比例恢复,获得最优化求解后的风机功率。 (来 自 专利查询网)

专利主权项内容

1.一种海洋平台通风系统分层优化控制方法,其特征在于,所述海洋平台包括风机、主通风管路及多个舱室,所述风机连通主通风管路,主通风管路上设置有总风阀,所述主通风管路与每个舱室连通;每个舱室均设置有一个变量风箱,每个变量风箱处设置有一个舱室风阀;所述控制方法包括以下步骤:S1:定义每个舱室的舱室风阀为一个智能体;确定海洋平台通风系统的控制目标,并设计智能体强化学习要素;所述控制目标包括舱室二氧化碳浓度控制目标,风机静压、舱室风阀开度、舱室通风量控制目标,实际风量比例误差控制目标,舱室风阀控制限制目标,风阀及风机协调控制目标;所述强化学习要素包括舱室风阀智能体状态要素、舱室风阀智能体动作要素以及舱室风阀智能体奖励要素;S2:根据设定的海洋平台通风系统控制目标、强化学习要素,基于SAC算法,采用策略-价值网络对舱室风阀智能体进行训练,获得海洋平台通风系统各舱室的需求风量;S3:基于舱室通风量控制目标,对海洋平台通风系统风量进行比例平衡控制,控制所有舱室的实际风量与需求风量的比例误差最小,求解获得需求风量比例一致的最优舱室风阀角度;S4:根据比例平衡控制的求解结果,进行比例恢复,获得最优化求解后的风机功率;所述海洋平台通风系统的控制目标包括以下目标之一或组合:目标1:舱室二氧化碳浓度控制目标:式中表示时刻舱室/>的CO实时浓度;/>表示舱室/>的CO浓度上限;/>表示舱室/>的CO浓度节能下限;/>表示舱室数量;t222目标2:风机静压、舱室风阀开度、舱室通风量控制目标:式中,表示/>时刻风机静压,/>和/>表示风机静压的规定运行范围,/>为风机静压最小压力值,/>为风机静压最大压力值;/>表示/>时刻舱室/>的舱室风阀角度,和/>表示舱室/>舱室风阀的动作限制范围,/>为舱室/>舱室风阀的最小风阀角度,为舱室/>舱室风阀的最大风阀角度;/>表示/>时刻舱室/>的需求风量,/>和/>表示舱室/>需求风量的限制范围,/>为舱室/>需求风量最小值,/>为舱室/>需求风量最大值;目标3:实际风量比例误差控制目标:式中表示在/>时刻舱室/>的实际风量;/>表示气流速率相对误差;/>表示舱室数量;目标4:舱室风阀控制限制目标,应保证至少有一个风阀完全打开:当时,表示舱室/>的舱室风阀完全打开;目标5:风阀及风机协调控制目标:式中表示节能控制目标下的最大风机静压;/>表示海洋平台通风系统节能控制目标下舱室风阀的最大风阀角度;所述舱室风阀智能体状态的定义:其中,表示/>时刻舱室/>的CO浓度;/>表示/>时刻舱室外的CO浓度;/>表示/>时刻舱室的需求风量;/>表示/>时刻舱室/>的人数;/>表示/>时刻的人体代谢率;22舱室风阀智能体动作的定义:其中,表示/>时刻舱室/>的风量变化量,/>>所述风阀智能体训练奖励要素包括:其中,为阈值塑形奖励函数,/>表示引导智能体学习的CO浓度的奖励塑形下限,表示同时满足所有舱室CO浓度限制和通风节能要求时的奖励值,表示舱室CO浓度的阈值塑形奖励值;/>为收敛加速奖励函数;表示收敛加速奖励值;/>为边界限制奖励函数;/>表示所有舱室在/>时刻的CO浓度的相对误差的集合,/>表示舱室/>在/>时刻的CO浓度的相对误差,/>表示舱室数量;/>为风量规范奖励函数;k2c12c22c322设计强化学习奖励函数:其中,,/>,/>和/>是四个子奖励函数的正权重系数;其中,仅在满足下面两个公式时有效:其中,表示舱室风量变化量的下限 , />表示舱室风量变化量的上限;kk所述采用策略-价值网络对舱室风阀智能体进行训练的步骤包括:S21:设置基于最大熵的智能体训练损失函数:其中,表示温度系数;/>表示强化学习策略/>允许的状态-动作对;/>表示计算期望;/>表示在舱室风阀智能体状态/>选取舱室风阀智能体动作/>所得的奖励;/>表示对强化学习的策略;/>是策略熵,用于测量动作概率分布的不确定性,其定义为:其中,表示分布/>的取值:

;S22:计算SAC算法的最优策略:S23:定义柔性动作函数,进行柔性动作函数策略评估,使用柔性贝尔曼方程固定策略/>并更新/>值,直到/>值收敛:其中,是柔性动作函数;/>表示折扣因子;S24:采用收敛后的值改进强化学习的策略/>,将改进后的强化学习的策略/>带入柔性动作函数,更新策略并得到新/>函数的指数:其中,表示更新后的策略;/>表示更新前的策略;/>表示可行策略集合;/>表示更新前策略的/>值函数;/>表示用于规范化策略分布的配分函数;步骤S24中,用KL散度来约束策略更新的范围:

表示用于测量分布/>和/>差异的KL散度,/>表示分布/>的取值;/>表示分布/>的取值,/>用于计算S24中新/>函数的指数/>,此时分布/>;分布=;Y所述步骤S2中,使用训练好的强化学习智能体获取当前时刻各舱室的需求风量的步骤包括:利用训练好的强化学习智能体, 根据t时刻强化学习智能体所处的状态,获取时刻海洋平台各舱室的需求风量的集合:t其中, 表示/>时刻舱室/>的需求风量;所述步骤S3包括:S31 : 将风量精确控制问题转化如下的比例等式:
;其中,为/>时刻实际风量集合;/>为上层需求风量的集合;/>表示用于归一化的单位行向量;S32:将风量精确控制问题转变为约束优化问题,第一目标函数设计为 :

表示/>时刻舱室/>的舱室风阀的开度; S33:根据节能控制目标,第二目标函数设计为:其中,表示舱室/>的舱室风阀的最大开度;S34:第三目标函数设计为:其中:表示/>时刻风机静压;S35:整合获得总目标函数:其中,, />, />为平衡权重系数;S36:基于总目标函数,采用GA-fminconHSO方法最优风阀角度求解,获得时刻舱室/>最佳风阀角度下的风量/>;所述步骤S4包括:基于计算获得实际风量:其中,为GA-fmincon HSO方法优化求解后在/>时刻舱室/>最佳风阀角度下的风量;为风量恢复比例,为小于1的正数;/>为/>时刻舱室/>的实际风量;采用比例控制的控制方案控制风机功率,根据某一舱室终端的风量调节风机功率,选取各比例的中位数,匹配风机功率调节比例如下:其中,为比例恢复后的风机实际功率;/>为GA-fmincon HSO方法优化求解后的风机功率;/>表示所有舱室恢复比例集合的中值。