← 返回列表
基于强化学习伪谱网格自适应构造的轨迹快速优化方法
摘要文本
一种基于强化学习伪谱网格自适应构造的轨迹快速优化方法,属于飞行器控制技术领域。方法如下:构建飞行器动力学与运动学模型,设置飞行轨迹初值及约束条件,并基于伪谱法构建飞行器轨迹优化问题;计算相邻两配点中点的残差矩阵,并以残差矩阵的二范数作为网络评价方法进行评价;通过DDPG强化学习得到新的Online‑Actor网络对伪谱离散网格进行设计,将连续轨迹优化问题转化为非线性规划问题,并使用序列二次规划方法进行求解。本发明利用强化学习完成神经网络的快速训练,基于神经网络对伪谱离散网格进行快速准确构造,解决了重复迭代带来的求解时间过长的问题,进而完成飞行器轨迹的快速优化。 来自:
申请人信息
- 申请人:哈尔滨工业大学
- 申请人地址:150001 黑龙江省哈尔滨市南岗区西大直街92号
- 发明人: 哈尔滨工业大学
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 基于强化学习伪谱网格自适应构造的轨迹快速优化方法 |
| 专利类型 | 发明申请 |
| 申请号 | CN202311692640.9 |
| 申请日 | 2023/12/11 |
| 公告号 | CN117434845A |
| 公开日 | 2024/1/23 |
| IPC主分类号 | G05B13/04 |
| 权利人 | 哈尔滨工业大学 |
| 发明人 | 韦常柱; 崔乃刚; 孙智力; 魏金鹏; 浦甲伦 |
| 地址 | 黑龙江省哈尔滨市南岗区西大直街92号 |
专利主权项内容
1.一种基于强化学习伪谱网格自适应构造的轨迹快速优化方法,其特征在于:所述方法包括如下步骤:S1:构建飞行器动力学与运动学模型,设置飞行轨迹初值及约束条件,并基于伪谱法构建飞行器轨迹优化问题;S2:计算相邻两配点中点的残差矩阵R,并以残差矩阵R的二范数||R||作为网络评价方法进行评价;2S3:通过DDPG强化学习得到新的Online-Actor网络;S4:通过S3所训练出的网络对伪谱离散网格进行设计,将连续轨迹优化问题转化为非线性规划问题,并使用序列二次规划方法进行求解。