← 返回列表

一种智能空战决策方法、系统及电子设备

申请号: CN202310889524.X
申请人: 北京师范大学
申请日期: 2023/7/20

摘要文本

本发明提供了一种智能空战决策方法、系统及电子设备,属于人工智能领域,方法包括:针对任一飞机,根据当前时刻飞机的观测数据、前一时刻飞机的隐状态及前一时刻飞机的动作,基于空战策略模型,确定当前时刻飞机的动作,以调整飞机的运行状态;空战策略模型为预先采用自博弈算法进行智能体联盟对抗训练得到的;空战策略模型包括状态预测模型及动作预测模型;状态预测模型为预先根据历史交互数据,基于轨迹判别器,对世界模型进行训练得到的;历史交互数据包括历史设定时段内飞机的观测数据、隐状态及动作;动作预测模型为预先基于融合奖励,根据历史设定时段内飞机的隐状态,对演员评论家模型进行训练得到的。本发明提高了空战策略的准确度。

专利详细信息

项目 内容
专利名称 一种智能空战决策方法、系统及电子设备
专利类型 发明申请
申请号 CN202310889524.X
申请日 2023/7/20
公告号 CN117556681A
公开日 2024/2/13
IPC主分类号 G06F30/27
权利人 北京师范大学
发明人 段福庆; 曲拓
地址 北京市海淀区新外大街19号

专利主权项内容

1.一种智能空战决策方法,其特征在于,所述智能空战决策方法包括:针对任一飞机,获取当前时刻所述飞机的观测数据、前一时刻所述飞机的隐状态及前一时刻所述飞机的动作;根据当前时刻所述飞机的观测数据、前一时刻所述飞机的隐状态及前一时刻所述飞机的动作,基于空战策略模型,确定当前时刻所述飞机的动作,以调整所述飞机的运行状态;所述空战策略模型为预先采用自博弈算法进行智能体联盟对抗训练得到的;所述空战策略模型包括状态预测模型及动作预测模型;所述状态预测模型为预先根据历史交互数据,基于轨迹判别器,对世界模型进行训练得到的;所述历史交互数据包括历史设定时段内飞机的观测数据、隐状态及动作;所述动作预测模型为预先基于融合奖励,根据历史设定时段内飞机的隐状态,对演员评论家模型进行训练得到的;所述状态预测模型用于根据当前时刻飞机的观测数据、前一时刻飞机的隐状态及前一时刻飞机的动作,确定当前时刻飞机的隐状态;所述动作预测模型用于根据当前时刻飞机的隐状态,确定当前时刻飞机的动作。