低轨卫星网络中多地面用户的接入选择方法和装置
摘要文本
本发明提供了一种低轨卫星网络中多地面用户的接入选择方法和装置,涉及通信的技术领域,地面用户不断与低轨卫星网络环境进行交互,得到预设连续时隙下的状态空间,进而以最大化全局奖励为目标,基于所有地面用户在预设连续时隙下的状态空间对初始多智能体深度强化学习模型进行训练,得到目标多智能体深度强化学习模型;全局奖励与所有地面用户的和速率正相关,与卫星服务用户数量的方差负相关,模型中的智能体与地面用户一一对应。利用训练后智能体的网络参数更新相应地面用户的接入选择模型的网络参数,以使接入选择模型基于更新后的网络参数选择待接入的卫星。该方法在保证吞吐量的同时达到更优的卫星间负载均衡,还能降低地面用户的信令开销。
申请人信息
- 申请人:北京邮电大学
- 申请人地址:100089 北京市海淀区西土城路10号
- 发明人: 北京邮电大学
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 低轨卫星网络中多地面用户的接入选择方法和装置 |
| 专利类型 | 发明申请 |
| 申请号 | CN202410153912.6 |
| 申请日 | 2024/2/4 |
| 公告号 | CN117692052A |
| 公开日 | 2024/3/12 |
| IPC主分类号 | H04B7/185 |
| 权利人 | 北京邮电大学 |
| 发明人 | 贾浩歌; 吴胜; 卢文强 |
| 地址 | 北京市海淀区西土城路10号 |
专利主权项内容
1.一种低轨卫星网络中多地面用户的接入选择方法,其特征在于,包括:获取目标时隙下低轨卫星网络中每个卫星的位置信息和每个地面用户的位置信息;其中,所述目标时隙表示预设连续时隙中的任一时隙;基于目标用户的位置信息和每个卫星的位置信息,确定所述目标用户在目标时隙的状态空间;其中,所述目标用户表示所述低轨卫星网络中的任一地面用户;所述状态空间为所述目标用户与每个卫星之间距离的集合;以最大化全局奖励为目标,基于所有地面用户在所述预设连续时隙下的状态空间对初始多智能体深度强化学习模型进行训练,得到目标多智能体深度强化学习模型;其中,所述全局奖励与所有地面用户的和速率正相关,且与卫星服务用户数量的方差负相关;所述初始多智能体深度强化学习模型中的智能体与地面用户一一对应,所述初始多智能体深度强化学习模型中智能体的网络参数与其对应的地面用户的接入选择模型的网络参数相同,所述智能体的状态空间为与其对应的地面用户的状态空间,所述智能体的动作表示地面用户选择接入的卫星;利用所述目标多智能体深度强化学习模型中目标智能体的网络参数更新其对应的地面用户的接入选择模型的网络参数,以使该地面用户的接入选择模型基于更新后的网络参数选择待接入的卫星。