面向博弈对抗任务的多行为树决策方案聚合方法和装置
摘要文本
本发明提供一种面向博弈对抗任务的多行为树决策方案聚合方法和装置,涉及计算机技术领域,方法包括:构建各行为树对应的行为树集合;构建行为树集合对应的多个规约候选对象集合;对于行为树集合中的规约候选对象集合,分别执行步骤a‑步骤c:步骤a、分别对各执行单元结构的条件节点进行决策依据要素规约;步骤b、分别对各执行单元结构的行动节点进行决策控制要素规约;步骤c、对各执行单元结构的条件节点和行动节点进行聚合,得到规约候选对象集合对应的聚合执行单元;根据行为树集合中各个规约候选对象集合对应的聚合执行单元,确定行为树集合对应的聚合行为树。本发明能够提升博弈对抗决策方案的生成效率和泛化能力。
申请人信息
- 申请人:中国人民解放军军事科学院国防科技创新研究院
- 申请人地址:100071 北京市丰台区东大街53号院
- 发明人: 中国人民解放军军事科学院国防科技创新研究院
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 面向博弈对抗任务的多行为树决策方案聚合方法和装置 |
| 专利类型 | 发明申请 |
| 申请号 | CN202410142819.5 |
| 申请日 | 2024/2/1 |
| 公告号 | CN117669710A |
| 公开日 | 2024/3/8 |
| IPC主分类号 | G06N5/01 |
| 权利人 | 中国人民解放军军事科学院国防科技创新研究院 |
| 发明人 | 李渊; 刘运韬; 李晟泽; 章杰元; 张峰; 顾孔静 |
| 地址 | 北京市丰台区东大街53号院 |
专利主权项内容
1.一种面向博弈对抗任务的多行为树决策方案聚合方法,其特征在于,包括:根据多个面向博弈对抗任务的行为树的执行单元结构,构建各所述行为树对应的行为树集合,所述行为树集合中包括各所述行为树的执行单元结构;根据所述行为树集合对应的至少一个时间区间,构建所述行为树集合对应的多个规约候选对象集合,每个规约候选对象集合中包括各所述行为树中在同一个时间区间控制同一个智能体的多个执行单元结构;对于所述行为树集合中的规约候选对象集合,分别执行步骤a-步骤c:步骤a、根据所述规约候选对象集合中各个执行单元结构的条件节点中决策依据要素的类型,分别对各所述执行单元结构的条件节点进行决策依据要素规约;步骤b、根据所述规约候选对象集合中各所述执行单元结构的行动节点中决策控制要素的类型和相互关系,分别对各所述执行单元结构的行动节点进行决策控制要素规约;步骤c、对各所述执行单元结构的条件节点和行动节点进行聚合,得到所述规约候选对象集合对应的聚合执行单元;根据所述行为树集合中各个规约候选对象集合对应的聚合执行单元,确定所述行为树集合对应的聚合行为树。