← 返回列表

一种基于强化学习的频域抗干扰方法及系统

申请号: CN202410182440.7
申请人: 中国电子科技集团公司第十研究所
申请日期: 2024/2/19

摘要文本

本发明公开了一种基于强化学习的频域抗干扰方法及系统,该方法包括发射机与接收机通过通信链路传输数据,并通过控制链路传递控制信息;当通信用户进行数据传输时,多个模式化干扰机产生干扰信号以干扰通信用户;智能体嵌入接收机中,将发射机和接收机的一个通信周期划分为多个子帧,每个子帧包含多个时隙,并计算所有时隙通道躲避率;判断躲避率是否达到预设门限值,若未达到预设门限值,则使用WDQL算法进行训练并更新通道策略,再将经过更新的通道策略和NACK通过控制链路发送给发射机,并开始下一通信周期的数据传输。本发明不仅保证了较低的迭代时间和计算复杂度,还实现了快速的训练决策速度,抗干扰性能优。

专利详细信息

项目 内容
专利名称 一种基于强化学习的频域抗干扰方法及系统
专利类型 发明申请
申请号 CN202410182440.7
申请日 2024/2/19
公告号 CN117750525A
公开日 2024/3/22
IPC主分类号 H04W72/50
权利人 中国电子科技集团公司第十研究所
发明人 李刚; 吴麒; 王翔; 董珊珊; 罗浩; 乔冠华
地址 四川省成都市金牛区茶店子东街48号

专利主权项内容

1.一种基于强化学习的频域抗干扰方法,其特征在于,包括:步骤1:将相互通信的发射机和接收机作为通信用户,发射机与接收机通过通信链路传输数据,并通过控制链路传递控制信息,控制信息包括通道策略和NACK;当通信用户进行数据传输时,多个模式化干扰机产生干扰信号以干扰通信用户;步骤2:智能体嵌入接收机中,将发射机和接收机的一个通信周期划分为多个子帧,每个子帧包含多个时隙,并计算所有时隙通道躲避率;步骤3:判断躲避率是否达到预设门限值,若未达到预设门限值,则使用WDQL算法进行训练并更新通道策略,再将经过更新的通道策略和NACK通过控制链路发送给发射机,并开始下一通信周期的数据传输。