← 返回列表
基于深度强化学习的无人机对地目标跟踪与避障规划方法
摘要文本
本发明涉及无人机目标跟踪技术领域,提供一种基于深度强化学习的无人机对地目标跟踪与避障规划方法,首先,构建了无人机同时对地目标跟踪与避障任务的马尔可夫模型,并设置了无人机可视性约束、对地目标跟踪、避障等奖励函数,让无人机在进行对地目标跟踪任务的同时始终保证目标在无人机的可视范围内,提高了可靠性。随后,使用改进的DDPG深度强化学习算法进行训练,并将每一回合的经验保存于经验池中作为学习样本,不断迭代更新神经网络的参数。当训练完成后,将保存好的数据加载至无人机系统之中,从而执行飞行动作完成目标跟踪和路径规划任务。本发明能在无人机完成跟踪与避障的同时,有效防止跟踪目标的信息丢失。
申请人信息
- 申请人:中国民用航空飞行学院
- 申请人地址:618307 四川省德阳市广汉市南昌路四段46号
- 发明人: 中国民用航空飞行学院
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 基于深度强化学习的无人机对地目标跟踪与避障规划方法 |
| 专利类型 | 发明申请 |
| 申请号 | CN202410170297.X |
| 申请日 | 2024/2/6 |
| 公告号 | CN117707207A |
| 公开日 | 2024/3/15 |
| IPC主分类号 | G05D1/46 |
| 权利人 | 中国民用航空飞行学院 |
| 发明人 | 付贵; 陶荣静; 张小强 |
| 地址 | 四川省德阳市广汉市南昌路四段46号 |
专利主权项内容
1.基于深度强化学习的无人机对地目标跟踪与避障规划方法,其特征在于:包括以下步骤:步骤1:构建无人机对地目标跟踪的马尔可夫模型;步骤2:定义基于可视性约束的奖励函数;步骤3:搭建改进后的深度确定性策略梯度DDPG算法;步骤4:使用改进后的深度确定性策略梯度DDPG算法训练无人机,并将训练好的数据加载至无人机系统之中,从而执行飞行动作完成目标跟踪和路径规划任务。