← 返回列表
一种基于深度强化学习的认知通扰一体化波束形成方法
申请人信息
- 申请人:中国人民解放军陆军工程大学
- 申请人地址:210007 江苏省南京市秦淮区后标营路88号
- 发明人: 中国人民解放军陆军工程大学
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种基于深度强化学习的认知通扰一体化波束形成方法 |
| 专利类型 | 发明申请 |
| 申请号 | CN202311586370.3 |
| 申请日 | 2023/11/27 |
| 公告号 | CN117614501A |
| 公开日 | 2024/2/27 |
| IPC主分类号 | H04B7/06 |
| 权利人 | 中国人民解放军陆军工程大学 |
| 发明人 | 丁国如; 谷江春; 王海超; 徐以涛; 李京华 |
| 地址 | 河北省石家庄市和平西路97号 |
摘要文本
本发明公开了一种基于深度强化学习的认知通扰一体化波束形成方法,包括:以合法接收机通信速率之和最大化为目标建立优化问题;将优化问题映射为马尔可夫决策过程,利用深度强化学习网络模型对合法收发机的波束赋形矩阵进行预测,将训练样本作为输入深度强化学习网络模型进行训练,重复迭代训练过程直到深度强化学习网络模型收敛;采集通信环境的状态信息输入至训练后的深度强化学习模型获得最优的决策策略,所述决策策略为通扰一体化的波束赋形矩阵;本发明能够在未知信道状态信息的状态下,所述合法收发机与L个合法接收机通信同时干扰非合作对抗网络,通过训练提升了通信的可靠性、干扰的精准性以及通扰一体化的认知水平。。专利查询网
专利主权项内容
1.一种基于深度强化学习的认知通扰一体化波束形成方法,其特征在于,包括:采集通信环境的状态信息输入至训练后的深度强化学习模型,获得最优的决策策略,所述决策策略为通扰一体化的波束赋形矩阵;所述深度强化学习模型的构建和训练过程包括:基于通信模拟环境构建通信和干扰一体化模型;添加非合作对抗网络中可疑通信组的干扰约束和合法收发机的最大发射功率约束,以合法接收机通信速率之和最大化为目标建立优化问题;将优化问题映射为马尔可夫决策过程,以合法收发机为智能体构建深度强化学习网络模型,利用深度强化学习网络模型对合法收发机的波束赋形矩阵进行预测,通过合法收发机和通信模拟环境进行交互获得训练样本,将训练样本作为输入深度强化学习网络模型进行训练,重复迭代训练过程直到深度强化学习网络模型收敛。。(来 自 马 克 数 据 网)