一种面向异构多智能体的多任务策略博弈方法

申请号: CN202311525055.X

申请人: 杭州智元研究院有限公司

申请日期: 2023/11/15

摘要文本

本发明涉及一种面向异构多智能体的多任务策略博弈方法，包括：步骤S1：确定智能体系统中的所有任务集合；步骤S2：针对异构多智能体构建动力学模型；步骤S3：针对全局地图、其他单位的影响程度进行环境建模；步骤S4：针对异构多智能体的通讯结构，设计事件触发机制，在满足触发条件时进行通信；步骤S5：进行基于MADDPG的强化学习模型训练以得到所需策略。与现有技术相比，本发明能够充分考虑多个智能体的异构性，使得每个智能体都能够根据自身的特点选择最优策略；本方法能够在任务合作与竞争场景中实现高效的任务分配和决策，提高整个智能体系统的性能。

申请人信息

申请人:杭州智元研究院有限公司
申请人地址:310013 浙江省杭州市西湖区云展路188号
发明人: 杭州智元研究院有限公司

专利详细信息

项目	内容
专利名称	一种面向异构多智能体的多任务策略博弈方法
专利类型	发明申请
申请号	CN202311525055.X
申请日	2023/11/15
公告号	CN117575220A
公开日	2024/2/20
IPC主分类号	G06Q10/0631
权利人	杭州智元研究院有限公司
发明人	刘珂; 钱剑勇; 朱开元; 牛春阳; 黄聪聪; 祁凌云; 黄泽宇
地址	浙江省杭州市西湖区云展路188号

专利主权项内容

1.一种面向异构多智能体的多任务策略博弈方法，其特征在于，包括如下步骤：步骤S1：确定智能体系统中的所有任务集合；步骤S2：针对异构多智能体构建动力学模型；步骤S3：针对全局地图、其他单位的影响程度进行环境建模；步骤S4：构建异构多智能体的通信拓扑结构，设计事件触发条件，在满足触发条件时进行通信；步骤S5：基于任务集合确定强化学习过程的任务空间，将动力学模型和事件触发条件作为强化学习的约束条件，基于建立的环境模型，进行MADDPG的强化学习模型训练以得到所需策略，在训练过程中，基于设计的事件触发条件进行智能体之间的信息通信。

一种面向异构多智能体的多任务策略博弈方法

摘要文本

申请人信息

专利详细信息

专利主权项内容

热门技术领域

快速入口

专利技术资料

一种面向异构多智能体的多任务策略博弈方法

摘要文本

申请人信息

专利详细信息

专利主权项内容

相关专利推荐

一种耐磨损塑料模具钢及其制备方法

基于数字化控制的纺织印染废水的节能处理工艺

基于数字化控制的涤纶布料的节水印染系统

一种智能球头、应用方法及车辆

一种碳纤维氧化炉送风与回风分配装置

一种建筑整体保温性能检测主体及其检测方法

热门技术领域

快速入口

专利技术资料