← 返回列表

层次协同学习的多机围捕方法、装置、电子设备及介质

申请号: CN202311605045.7
申请人: 北京航空航天大学
申请日期: 2023/11/29

摘要文本

本申请提供一种层次协同学习的多机围捕方法、装置、电子设备及介质,涉及无人机集群技术。方法包括:根据当前的智能体联合状态和当前的逃逸目标状态,基于分层决策网络的顶层决策网络确定本次的目标阶段任务,将目标阶段任务对应的任务参数输入分层决策网络的底层决策网络,获得任务参数后的每个智能体的策略网络根据智能体状态和接收到的通信数据获得动作决策结果;根据每个智能体的策略网络获得的动作决策结果,控制各智能体执行相应的机动动作,以执行目标阶段任务下的多机协同追捕任务;分层决策网络为经过训练的网络,且训练基于多个阶段任务中每个阶段任务的奖励函数进行。本申请的方法,有效提高智能体的路径规划效果,实现多机协同围捕。 来源:专利查询网

专利详细信息

项目 内容
专利名称 层次协同学习的多机围捕方法、装置、电子设备及介质
专利类型 发明申请
申请号 CN202311605045.7
申请日 2023/11/29
公告号 CN117350326A
公开日 2024/1/5
IPC主分类号 G06N3/008
权利人 北京航空航天大学
发明人 李宇萌; 杨政智; 郭通; 王涛; 郑磊; 杜文博
地址 北京市海淀区学院路37号

专利主权项内容

1.一种层次协同学习的多机围捕方法,其特征在于,包括:获取当前的智能体联合状态和当前的逃逸目标状态;根据所述当前的智能体联合状态和所述当前的逃逸目标状态,基于分层决策网络的顶层决策网络确定本次的目标阶段任务,并将所述目标阶段任务对应的任务参数输入所述分层决策网络的底层决策网络,获得所述任务参数后的每个智能体的策略网络根据智能体状态和接收到的通信数据获得动作决策结果;根据每个智能体的策略网络获得的动作决策结果,控制各智能体执行相应的机动动作,以执行所述目标阶段任务下的多机协同追捕任务;其中,所述分层决策网络为经过训练的网络,且训练基于多个阶段任务中每个阶段任务的奖励函数进行,不同阶段任务的奖励函数不同。