← 返回列表
结合因果模型和深度强化学习的多智能体避障方法及系统
申请人信息
- 申请人:汕头大学
- 申请人地址:515063 广东省汕头市大学路汕头大学
- 发明人: 汕头大学
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 结合因果模型和深度强化学习的多智能体避障方法及系统 |
| 专利类型 | 发明申请 |
| 申请号 | CN202311014776.4 |
| 申请日 | 2023/8/11 |
| 公告号 | CN117406706A |
| 公开日 | 2024/1/16 |
| IPC主分类号 | G05D1/43 |
| 权利人 | 汕头大学 |
| 发明人 | 于沂渭; 范衠; 王顺鸽; 王诏君; 李文姬; 魏沛蔚; 翟昊; 郝志峰 |
| 地址 | 广东省汕头市大学路汕头大学 |
摘要文本
本发明公开了一种结合因果模型和深度强化学习的多智能体避障方法、系统、设备及介质,其中所述方法包括:针对多智能体中的每个智能体,实时获取所述智能体与目标点之间的相对位置信息、所述智能体的当前运行速度及其对周围环境采集到的连续三帧图像;利用因果模型对所述连续三帧图像进行学习,并在学习过程中利用马尔科夫毯进行特征筛选,得到有效特征信息;利用深度强化学习模型对所述有效特征信息、所述相对位置信息和所述当前运行速度进行处理,得到所述智能体在下一时刻的运动控制信息。本发明所提出的避障控制策略可以适用于不同的现实环境,并且可以在无通信环境下稳定执行。
专利主权项内容
1.一种结合因果模型和深度强化学习的多智能体避障方法,其特征在于,所述方法包括:针对多智能体中的每个智能体,实时获取所述智能体与目标点之间的相对位置信息、所述智能体的当前运行速度及其对周围环境采集到的连续三帧图像;利用因果模型对所述连续三帧图像进行学习,并在学习过程中利用马尔科夫毯进行特征筛选,得到有效特征信息;利用深度强化学习模型对所述有效特征信息、所述相对位置信息和所述当前运行速度进行处理,得到所述智能体在下一时刻的运动控制信息。 (来 自 马 克 数 据 网)