一种基于深度强化学习的磁流变阻尼器控制方法和装置
摘要文本
本发明公开了一种基于深度强化学习的磁流变阻尼器控制方法和装置,属于人工智能及智能建造技术领域。该方法包括以下步骤:建立磁流变阻尼器控制系统模型,建立磁流变阻尼器控制系统的微分方程,采用Bouc‑Wen模型建立磁流变阻尼器模型;选择深度Q‑learning作为深度强化学习模型并设置模型动作和状态,建立奖励评价函数;采集学习训练数据,模型训练输出模型参数,利用训练得到的模型对结构采用磁流变阻尼器进行减振控制。本发明通过深度强化学习引入深度神经网络函数拟合的方法,以预测连续状态值。该方法的应用有望提高磁流变阻尼器的控制精度,从而进一步增强其减振控制效果,为解决磁流变阻尼器控制中的挑战提供了新的途径。 关注公众号
申请人信息
- 申请人:中国电建集团昆明勘测设计研究院有限公司
- 申请人地址:650051 云南省昆明市盘龙区人民东路115号办公楼
- 发明人: 中国电建集团昆明勘测设计研究院有限公司
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种基于深度强化学习的磁流变阻尼器控制方法和装置 |
| 专利类型 | 发明申请 |
| 申请号 | CN202410218474.7 |
| 申请日 | 2024/2/28 |
| 公告号 | CN117807895A |
| 公开日 | 2024/4/2 |
| IPC主分类号 | G06F30/27 |
| 权利人 | 中国电建集团昆明勘测设计研究院有限公司 |
| 发明人 | 杨旸; 张宗亮; 杨再宏; 冯业林; 郑大伟; 黄青富; 宋洋; 王义; 罗军尧; 李函逾 |
| 地址 | 云南省昆明市人民东路115号办公楼 |
专利主权项内容
1.一种基于深度强化学习的磁流变阻尼器控制方法,其特征在于,包括:建立磁流变阻尼器控制系统模型,确定减振结构及磁流变阻尼器数量及控制位置,确定所述磁流变阻尼器控制系统的微分方程,采用Bouc-Wen模型建立磁流变阻尼器模型,计算所述磁流变阻尼器控制系统的控制力;采用深度Q-learning学习模型,由深度神经网络表示Q值函数,在所述深度Q-learning学习模型中将电流设置为磁流变阻尼器控制动作,将速度作为状态变量,建立奖励评价函数,以评估每个步骤的性能;求解磁流变阻尼器控制系统的微分方程,在不同状态下施加不同动作,收集对应的数据;使用收集的数据对所述深度Q-learning学习模型进行训练,通过最小化Q值函数的误差来优化网络参数,输出所述深度Q-learning学习模型的模型参数;采用训练得到的模型对磁流变阻尼器进行减振控制;所述使用收集的数据对所述深度Q-learning学习模型进行训练,通过最小化Q值函数的误差来优化网络参数,输出所述深度Q-learning学习模型的模型参数,还包括:获取环境初始状态,从时间步t=1到T进行循环更新目标网格;根据当前网络,基于/>-贪婪策略选择动作/>;执行动作,获得回报/>,环境状态变为/>,将/>储存到回放池中;若中数据足够,从中采用N个数据{/>};RRRi=1, …, N对于每个数据,用目标网络计算;最小化目标损失,以此更新当前网络/>,更新目标网络直到=T;t模型验证,在验证集上测试训练好的深度Q-learning学习模型;采用Bouc-Wen模型建立磁流变阻尼器模型,计算所述磁流变阻尼器控制系统的控制力,还包括:计算公式如下所示:
;
;式中:为磁流变减振器阻尼N;/>为与磁流变屈服应力相关的模型参数N/m;/>为弹簧刚度N/m;/>为磁流变材料屈服后黏性系数N·s/m;/>和/>为磁流变阻尼器活塞和缸体的相对位移m和相对速度m/s;/>为滞变位移m;/>为弹簧的初始变形m;/>为常数,由磁流变阻尼器结构特性决定。 马 克 数 据 网