层次协同学习的多机围捕方法、装置、电子设备及介质

申请号: CN202311605045.7

申请人: 北京航空航天大学

申请日期: 2023/11/29

摘要文本

本申请提供一种层次协同学习的多机围捕方法、装置、电子设备及介质，涉及无人机集群技术。方法包括：根据当前的智能体联合状态和当前的逃逸目标状态，基于分层决策网络的顶层决策网络确定本次的目标阶段任务，将目标阶段任务对应的任务参数输入分层决策网络的底层决策网络，获得任务参数后的每个智能体的策略网络根据智能体状态和接收到的通信数据获得动作决策结果；根据每个智能体的策略网络获得的动作决策结果，控制各智能体执行相应的机动动作，以执行目标阶段任务下的多机协同追捕任务；分层决策网络为经过训练的网络，且训练基于多个阶段任务中每个阶段任务的奖励函数进行。本申请的方法，有效提高智能体的路径规划效果，实现多机协同围捕。来源：专利查询网

申请人信息

申请人:北京航空航天大学
申请人地址:100191 北京市海淀区学院路37号
发明人: 北京航空航天大学

专利详细信息

项目	内容
专利名称	层次协同学习的多机围捕方法、装置、电子设备及介质
专利类型	发明申请
申请号	CN202311605045.7
申请日	2023/11/29
公告号	CN117350326A
公开日	2024/1/5
IPC主分类号	G06N3/008
权利人	北京航空航天大学
发明人	李宇萌; 杨政智; 郭通; 王涛; 郑磊; 杜文博
地址	北京市海淀区学院路37号

专利主权项内容

1.一种层次协同学习的多机围捕方法，其特征在于，包括：获取当前的智能体联合状态和当前的逃逸目标状态；根据所述当前的智能体联合状态和所述当前的逃逸目标状态，基于分层决策网络的顶层决策网络确定本次的目标阶段任务，并将所述目标阶段任务对应的任务参数输入所述分层决策网络的底层决策网络，获得所述任务参数后的每个智能体的策略网络根据智能体状态和接收到的通信数据获得动作决策结果；根据每个智能体的策略网络获得的动作决策结果，控制各智能体执行相应的机动动作，以执行所述目标阶段任务下的多机协同追捕任务；其中，所述分层决策网络为经过训练的网络，且训练基于多个阶段任务中每个阶段任务的奖励函数进行，不同阶段任务的奖励函数不同。

层次协同学习的多机围捕方法、装置、电子设备及介质

摘要文本

申请人信息

专利详细信息

专利主权项内容

热门技术领域

快速入口

专利技术资料

特别鸣谢

层次协同学习的多机围捕方法、装置、电子设备及介质

摘要文本

申请人信息

专利详细信息

专利主权项内容

相关专利推荐

一种高频变压器串并联倍流输出的整流电路

沙发(HSN-6053)

时延对齐方法及装置

一种高脱色竹制活性碳及其制备工艺

床(HSN-B016)

座椅部件(GF-82733H)

热门技术领域

快速入口

专利技术资料

特别鸣谢