← 返回列表
一种气动软体机器人的位置控制方法及其系统、设备
摘要文本
本发明公开了一种气动软体机器人的位置控制方法及其系统、设备,所述方法通过随机策略得到包含若干状态以及对应动作数据组的初始数据集,再将上述数据集作为训练输入,使用代表高斯过程功能映射与实际状态之间差异的差分变量作为训练目标,利用贝叶斯推断所获得的差分变量的后验预测分布表示动力学模型中的传递动力学函数,最后利用所学习的动力学模型计算预测状态分布,并以预期长期损失最小为目标优化策略参数,实现更新策略。本发明利用概率模型代替实际动力学模型,进而减轻模型偏差,解决了现有方法过度依赖精确动力学模型的问题。
申请人信息
- 申请人:哈尔滨工业大学
- 申请人地址:150001 黑龙江省哈尔滨市南岗区西大直街92号
- 发明人: 哈尔滨工业大学
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种气动软体机器人的位置控制方法及其系统、设备 |
| 专利类型 | 发明申请 |
| 申请号 | CN202311626768.5 |
| 申请日 | 2023/11/30 |
| 公告号 | CN117444978A |
| 公开日 | 2024/1/26 |
| IPC主分类号 | B25J9/16 |
| 权利人 | 哈尔滨工业大学 |
| 发明人 | 高席丰; 晏祯卓; 赵鹏越; 刘欢 |
| 地址 | 黑龙江省哈尔滨市南岗区西大直街92号 |
专利主权项内容
1.一种气动软体机器人的位置控制方法,其特征在于所述方法包括如下步骤:步骤S1、获得初始经验池:为控制器施加随机策略,利用系统中的传感器获得包含若干机器人状态以及对应控制器动作数据组的初始数据集;步骤S2、动力学模型学习:将步骤S1获得的初始数据集作为训练输入,并使用代表高斯过程功能映射与实际状态之间差异的差分变量作为训练目标;对于已知的策略,利用贝叶斯推断所获得的差分变量的后验预测分布表示动力学模型中的传递动力学函数;步骤S3、策略更新:利用步骤S2所学习的动力学模型计算预测状态分布,评估长期损失,并以预期长期损失最小为目标优化策略参数,实现更新策略。