← 返回列表

一种基于强化学习的分布式能源实时调度方法及系统

申请号: CN202311852643.4
申请人: 国网江苏省电力有限公司信息通信分公司
更新日期: 2026-03-10

专利详细信息

项目 内容
专利名称 一种基于强化学习的分布式能源实时调度方法及系统
专利类型 发明申请
申请号 CN202311852643.4
申请日 2023/12/29
公告号 CN117726133A
公开日 2024/3/19
IPC主分类号 G06Q10/0631
权利人 国网江苏省电力有限公司信息通信分公司
发明人 王凌; 陈欣; 余竞航; 赵一辰; 毕思博; 邹昊东; 牧军; 陈斌
地址 江苏省南京市鼓楼区北京西路20号

摘要文本

本发明公开了一种基于强化学习的分布式能源实时调度方法及系统,属于数据处理技术领域,方法包括:构建分布式能源实时调度的智能体,智能体包括:状态空间、动作空间以及奖励函数,状态空间包括能源状态;动作空间包括能源调度动作;奖励函数用于根据能源调度动作的实施效果,为智能体提供奖励或者惩罚;根据历史能源状态,基于长短时记忆神经网络,预测下一时刻的能源状态;根据下一时刻的能源状态预测值,在约束条件的约束下,基于改进的近端策略优化算法,确定下一时刻的调度动作;根据调度动作,向各个区域分配各个分布式能源设备产生的能源;根据能源调度动作的实施效果,通过奖励函数,为智能体提供奖励或者惩罚。

专利主权项内容

微信公众号马克数据网 1.一种基于强化学习的分布式能源实时调度方法,其特征在于,包括:S1:构建分布式能源实时调度的智能体,所述智能体包括:状态空间、动作空间以及奖励函数,所述状态空间包括能源状态,所述能源状态包括各个区域的能源需求量以及各个分布式能源设备的能源生产量;所述动作空间包括能源调度动作;所述奖励函数用于根据所述能源调度动作的实施效果,为所述智能体提供奖励或者惩罚;S2:根据历史能源状态,基于长短时记忆神经网络,预测下一时刻的能源状态;S3:根据下一时刻的能源状态预测值,在约束条件的约束下,基于改进的近端策略优化算法,确定下一时刻的调度动作;S4:根据所述调度动作,向各个区域分配各个分布式能源设备产生的能源;S5:根据所述能源调度动作的实施效果,通过所述奖励函数,为所述智能体提供奖励或者惩罚,返回S2。