← 返回列表
一种水下自主航行器协同搜索路径规划方法
摘要文本
本发明是一种水下自主航行器协同搜索路径规划方法。本发明涉及水下机器人的路径规划技术领域,本发明根据任务需求对水下自主航行器与其环境进行建模仿真,使其能够输出航行器的观测值、执行该动作的奖励以及下一时刻的环境状态。本发明通过运用多智能体强化学习的知识,获取一种水下自主航行器协同搜索路径规划方法。通过本申请提出的策略网络与价值网络,实时规划水下航行器的运动路径,提高航行器协同海洋目标搜索的平均搜索成功率,降低海洋目标搜索的平均搜索时间。
申请人信息
- 申请人:吉林大学
- 申请人地址:130012 吉林省长春市前进大街2699号
- 发明人: 吉林大学
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种水下自主航行器协同搜索路径规划方法 |
| 专利类型 | 发明申请 |
| 申请号 | CN202410089404.6 |
| 申请日 | 2024/1/23 |
| 公告号 | CN117606490A |
| 公开日 | 2024/2/27 |
| IPC主分类号 | G01C21/20 |
| 权利人 | 吉林大学 |
| 发明人 | 姜宇; 齐红; 徐岳龙; 张凯欣; 赵明浩; 王凯 |
| 地址 | 吉林省长春市长春高新技术产业开发区前进大街2699号 |
专利主权项内容
1.一种水下自主航行器协同搜索路径规划方法,其特征是:所述方法包括以下步骤:步骤1、根据任务需求对水下自主航行器与其环境进行建模仿真,使其能够输出航行器的观测值、执行动作的奖励以及下一时刻的环境状态;步骤2、使用策略网络,根据输入的观测值,输出水下自主航行器下一步的期望动作;步骤3、动作输入模型环境中,得到下一时刻的水下自主航行器的观测值以及奖励,并将这一动作保存到经验池中;步骤4、重复步骤2、3直到航行器无法继续航行;步骤5、将经验池中的数据输入到价值网络中进行学习,输出其价值,并优化其价值函数与策略函数;步骤6、重复执行步骤2、3、4、5直至函数收敛;步骤7、根据策略输出最优路径。