← 返回列表
一种面向异构多智能体的多任务策略博弈方法
摘要文本
本发明涉及一种面向异构多智能体的多任务策略博弈方法,包括:步骤S1:确定智能体系统中的所有任务集合;步骤S2:针对异构多智能体构建动力学模型;步骤S3:针对全局地图、其他单位的影响程度进行环境建模;步骤S4:针对异构多智能体的通讯结构,设计事件触发机制,在满足触发条件时进行通信;步骤S5:进行基于MADDPG的强化学习模型训练以得到所需策略。与现有技术相比,本发明能够充分考虑多个智能体的异构性,使得每个智能体都能够根据自身的特点选择最优策略;本方法能够在任务合作与竞争场景中实现高效的任务分配和决策,提高整个智能体系统的性能。
申请人信息
- 申请人:杭州智元研究院有限公司
- 申请人地址:310013 浙江省杭州市西湖区云展路188号
- 发明人: 杭州智元研究院有限公司
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种面向异构多智能体的多任务策略博弈方法 |
| 专利类型 | 发明申请 |
| 申请号 | CN202311525055.X |
| 申请日 | 2023/11/15 |
| 公告号 | CN117575220A |
| 公开日 | 2024/2/20 |
| IPC主分类号 | G06Q10/0631 |
| 权利人 | 杭州智元研究院有限公司 |
| 发明人 | 刘珂; 钱剑勇; 朱开元; 牛春阳; 黄聪聪; 祁凌云; 黄泽宇 |
| 地址 | 浙江省杭州市西湖区云展路188号 |
专利主权项内容
1.一种面向异构多智能体的多任务策略博弈方法,其特征在于,包括如下步骤:步骤S1:确定智能体系统中的所有任务集合;步骤S2:针对异构多智能体构建动力学模型;步骤S3:针对全局地图、其他单位的影响程度进行环境建模;步骤S4:构建异构多智能体的通信拓扑结构,设计事件触发条件,在满足触发条件时进行通信;步骤S5:基于任务集合确定强化学习过程的任务空间,将动力学模型和事件触发条件作为强化学习的约束条件,基于建立的环境模型,进行MADDPG的强化学习模型训练以得到所需策略,在训练过程中,基于设计的事件触发条件进行智能体之间的信息通信。