← 返回列表

一种面向异构多智能体的多任务策略博弈方法

申请号: CN202311525055.X
申请人: 杭州智元研究院有限公司
申请日期: 2023/11/15

摘要文本

本发明涉及一种面向异构多智能体的多任务策略博弈方法,包括:步骤S1:确定智能体系统中的所有任务集合;步骤S2:针对异构多智能体构建动力学模型;步骤S3:针对全局地图、其他单位的影响程度进行环境建模;步骤S4:针对异构多智能体的通讯结构,设计事件触发机制,在满足触发条件时进行通信;步骤S5:进行基于MADDPG的强化学习模型训练以得到所需策略。与现有技术相比,本发明能够充分考虑多个智能体的异构性,使得每个智能体都能够根据自身的特点选择最优策略;本方法能够在任务合作与竞争场景中实现高效的任务分配和决策,提高整个智能体系统的性能。

专利详细信息

项目 内容
专利名称 一种面向异构多智能体的多任务策略博弈方法
专利类型 发明申请
申请号 CN202311525055.X
申请日 2023/11/15
公告号 CN117575220A
公开日 2024/2/20
IPC主分类号 G06Q10/0631
权利人 杭州智元研究院有限公司
发明人 刘珂; 钱剑勇; 朱开元; 牛春阳; 黄聪聪; 祁凌云; 黄泽宇
地址 浙江省杭州市西湖区云展路188号

专利主权项内容

1.一种面向异构多智能体的多任务策略博弈方法,其特征在于,包括如下步骤:步骤S1:确定智能体系统中的所有任务集合;步骤S2:针对异构多智能体构建动力学模型;步骤S3:针对全局地图、其他单位的影响程度进行环境建模;步骤S4:构建异构多智能体的通信拓扑结构,设计事件触发条件,在满足触发条件时进行通信;步骤S5:基于任务集合确定强化学习过程的任务空间,将动力学模型和事件触发条件作为强化学习的约束条件,基于建立的环境模型,进行MADDPG的强化学习模型训练以得到所需策略,在训练过程中,基于设计的事件触发条件进行智能体之间的信息通信。