← 返回列表
一种基于强化学习的分布式能源实时调度方法及系统
申请人信息
- 申请人:国网江苏省电力有限公司信息通信分公司
- 申请人地址:210000 江苏省南京市北京西路20号
- 发明人: 国网江苏省电力有限公司信息通信分公司
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种基于强化学习的分布式能源实时调度方法及系统 |
| 专利类型 | 发明申请 |
| 申请号 | CN202311852643.4 |
| 申请日 | 2023/12/29 |
| 公告号 | CN117726133A |
| 公开日 | 2024/3/19 |
| IPC主分类号 | G06Q10/0631 |
| 权利人 | 国网江苏省电力有限公司信息通信分公司 |
| 发明人 | 王凌; 陈欣; 余竞航; 赵一辰; 毕思博; 邹昊东; 牧军; 陈斌 |
| 地址 | 江苏省南京市鼓楼区北京西路20号 |
摘要文本
本发明公开了一种基于强化学习的分布式能源实时调度方法及系统,属于数据处理技术领域,方法包括:构建分布式能源实时调度的智能体,智能体包括:状态空间、动作空间以及奖励函数,状态空间包括能源状态;动作空间包括能源调度动作;奖励函数用于根据能源调度动作的实施效果,为智能体提供奖励或者惩罚;根据历史能源状态,基于长短时记忆神经网络,预测下一时刻的能源状态;根据下一时刻的能源状态预测值,在约束条件的约束下,基于改进的近端策略优化算法,确定下一时刻的调度动作;根据调度动作,向各个区域分配各个分布式能源设备产生的能源;根据能源调度动作的实施效果,通过奖励函数,为智能体提供奖励或者惩罚。
专利主权项内容
微信公众号马克数据网 1.一种基于强化学习的分布式能源实时调度方法,其特征在于,包括:S1:构建分布式能源实时调度的智能体,所述智能体包括:状态空间、动作空间以及奖励函数,所述状态空间包括能源状态,所述能源状态包括各个区域的能源需求量以及各个分布式能源设备的能源生产量;所述动作空间包括能源调度动作;所述奖励函数用于根据所述能源调度动作的实施效果,为所述智能体提供奖励或者惩罚;S2:根据历史能源状态,基于长短时记忆神经网络,预测下一时刻的能源状态;S3:根据下一时刻的能源状态预测值,在约束条件的约束下,基于改进的近端策略优化算法,确定下一时刻的调度动作;S4:根据所述调度动作,向各个区域分配各个分布式能源设备产生的能源;S5:根据所述能源调度动作的实施效果,通过所述奖励函数,为所述智能体提供奖励或者惩罚,返回S2。