基于强化学习伪谱网格自适应构造的轨迹快速优化方法

申请号: CN202311692640.9

申请人: 哈尔滨工业大学

申请日期: 2023/12/11

摘要文本

一种基于强化学习伪谱网格自适应构造的轨迹快速优化方法，属于飞行器控制技术领域。方法如下：构建飞行器动力学与运动学模型，设置飞行轨迹初值及约束条件，并基于伪谱法构建飞行器轨迹优化问题；计算相邻两配点中点的残差矩阵，并以残差矩阵的二范数作为网络评价方法进行评价；通过DDPG强化学习得到新的Online‑Actor网络对伪谱离散网格进行设计，将连续轨迹优化问题转化为非线性规划问题，并使用序列二次规划方法进行求解。本发明利用强化学习完成神经网络的快速训练，基于神经网络对伪谱离散网格进行快速准确构造，解决了重复迭代带来的求解时间过长的问题，进而完成飞行器轨迹的快速优化。来自：

申请人信息

申请人:哈尔滨工业大学
申请人地址:150001 黑龙江省哈尔滨市南岗区西大直街92号
发明人: 哈尔滨工业大学

专利详细信息

项目	内容
专利名称	基于强化学习伪谱网格自适应构造的轨迹快速优化方法
专利类型	发明申请
申请号	CN202311692640.9
申请日	2023/12/11
公告号	CN117434845A
公开日	2024/1/23
IPC主分类号	G05B13/04
权利人	哈尔滨工业大学
发明人	韦常柱; 崔乃刚; 孙智力; 魏金鹏; 浦甲伦
地址	黑龙江省哈尔滨市南岗区西大直街92号

专利主权项内容

1.一种基于强化学习伪谱网格自适应构造的轨迹快速优化方法，其特征在于：所述方法包括如下步骤：S1：构建飞行器动力学与运动学模型，设置飞行轨迹初值及约束条件，并基于伪谱法构建飞行器轨迹优化问题；S2：计算相邻两配点中点的残差矩阵R，并以残差矩阵R的二范数||R||作为网络评价方法进行评价；2S3：通过DDPG强化学习得到新的Online-Actor网络；S4：通过S3所训练出的网络对伪谱离散网格进行设计，将连续轨迹优化问题转化为非线性规划问题，并使用序列二次规划方法进行求解。

基于强化学习伪谱网格自适应构造的轨迹快速优化方法

摘要文本

申请人信息

专利详细信息

专利主权项内容

热门技术领域

快速入口

专利技术资料

基于强化学习伪谱网格自适应构造的轨迹快速优化方法

摘要文本

申请人信息

专利详细信息

专利主权项内容

相关专利推荐

一种全光产品的质量检测方法及系统

一种3D打印机脱料装置

一种基于试验数据库的压气机性能仿真程序精度评估方法

一种基于灰盒模型的节流阀响应预测方法

一种用于水性工业漆的加工装置

双辐板涡轮盘

热门技术领域

快速入口

专利技术资料