← 返回列表
一种基于MAPPO算法的WiFi网络资源调度方法及系统
摘要文本
本发明属于网络资源调度技术领域,尤其涉及一种基于MAPPO算法的WiFi网络资源调度方法及系统,AP获取每个STA对应的缓存队列的相关信息;将OFDMA资源调度问题建模为一个部分可见马尔可夫决策过程,并定义其中的状态、动作以及奖励函数;采用MAPPO深度强化学习算法求解最优策略;根据最优策略来控制OFDMA资源单元的调度本发明可以在有效地保证时延敏感节点可靠性的同时,最大化带宽型业务节点的吞吐量。本发明通过合理地设置全局奖励函数中的权重参数,在网络带宽为20MHz且总数据输入速率不超过20Mbps的情况下能够保障高达92.67%的可靠性。本发明在时延敏感业务和带宽型业务节点共存的上行网络场景中展现出良好的稳定性与泛化能力。
申请人信息
- 申请人:华中科技大学
- 申请人地址:430074 湖北省武汉市洪山区珞喻路1037号
- 发明人: 华中科技大学
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种基于MAPPO算法的WiFi网络资源调度方法及系统 |
| 专利类型 | 发明申请 |
| 申请号 | CN202311262615.7 |
| 申请日 | 2023/9/27 |
| 公告号 | CN117412323A |
| 公开日 | 2024/1/16 |
| IPC主分类号 | H04W24/06 |
| 权利人 | 华中科技大学 |
| 发明人 | 高雅玙; 贺俊杰; 谭清煜 |
| 地址 | 湖北省武汉市洪山区珞喻路1037号 |
专利主权项内容
1.一种基于MAPPO算法的WiFi网络资源调度方法,其特征在于,包括:S1,AP获取每个STA对应的缓存队列的相关信息;S2,将OFDMA资源调度问题建模为一个部分可见马尔可夫决策过程,并定义其中的状态、动作以及奖励函数;S3,采用MAPPO深度强化学习算法求解最优策略;S4,根据最优策略来控制OFDMA资源单元的调度。