← 返回列表
基于TD3算法的阀控液压缸强化学习分数阶控制方法及系统
摘要文本
本发明公开了一种基于TD3算法的阀控液压缸强化学习分数阶控制方法及系统,根据阀控液压缸控制原理,建立阀控液压缸的数学模型;设计加入干扰观测器的分数阶PID控制器对阀控液压缸系统进行控制;通过改进的TD3算法对分数阶PID控制器的参数进行优化调整;通过优化后的分数阶PID控制器对阀控液压缸进行控制。通过设计干扰观测器,提升系统的抗干扰能力,提升了控制系统鲁棒性,进一步通过改进的TD3算法不仅加快了网络的收敛性而且能更加有效的对分数阶PID的参数进行在线优化调整,使控制器能更好的发挥适应性与控制性能。
申请人信息
- 申请人:南京航空航天大学
- 申请人地址:210016 江苏省南京市秦淮区御道街29号
- 发明人: 南京航空航天大学
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 基于TD3算法的阀控液压缸强化学习分数阶控制方法及系统 |
| 专利类型 | 发明申请 |
| 申请号 | CN202410246853.7 |
| 申请日 | 2024/3/5 |
| 公告号 | CN117826580A |
| 公开日 | 2024/4/5 |
| IPC主分类号 | G05B11/42 |
| 权利人 | 南京航空航天大学 |
| 发明人 | 邵书义; 焦广鑫; 陈谋; 孙栋 |
| 地址 | 江苏省南京市秦淮区御道街29号 |
专利主权项内容
1.一种基于TD3算法的阀控液压缸强化学习分数阶控制方法,其特征在于,包括以下步骤:(1)根据阀控液压缸控制原理,建立阀控液压缸的数学模型;(2)设计加入干扰观测器的分数阶PID控制器对阀控液压缸系统进行控制;(3)通过改进的TD3算法对分数阶PID控制器的参数进行优化调整;所述改进的TD3算法中的奖励信号的表达式为:
;其中,为当前环境状态信号,/>为Actor网络输出的动作信号,/>为阀控液压缸系统的误差信号;(4)通过优化后的分数阶PID控制器对阀控液压缸进行控制。