← 返回列表
一种基于大模型的双臂操作任务学习方法和系统
摘要文本
本发明公开了一种基于大模型的双臂操作任务学习方法和系统,属于神经网络学习以及机器人技术领域。该方法包括,接收用于双臂操作的任务环境图和任务描述信息,将任务环境图和任务描述信息输入视觉语言大模型,分解为多个子任务;根据每个子任务对应的任务描述信息、任务感知空间信息和动作空间信息确定奖励函数,并基于强化学习模型进行训练,以构建相应的子任务模型,子任务模型分别用于完成各个子任务;根据多个子任务的操作顺序,依次调用多个子任务模型以执行双臂操作,并采集双臂轨迹数据集,通过模仿学习算法对双臂轨迹数据集进行学习,得到双臂操作策略。本发明实现了复杂双臂操作任务的学习,提高了操作策略的鲁棒性。
申请人信息
- 申请人:北京智源人工智能研究院
- 申请人地址:100084 北京市海淀区成府路150号5层501号
- 发明人: 北京智源人工智能研究院
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种基于大模型的双臂操作任务学习方法和系统 |
| 专利类型 | 发明申请 |
| 申请号 | CN202410096440.5 |
| 申请日 | 2024/1/23 |
| 公告号 | CN117697763A |
| 公开日 | 2024/3/15 |
| IPC主分类号 | B25J9/16 |
| 权利人 | 北京智源人工智能研究院 |
| 发明人 | 吴天昊 |
| 地址 | 北京市海淀区成府路150号5层501号 |
专利主权项内容
1.一种基于大模型的双臂操作任务学习方法,其特征在于,包括:接收用于双臂操作的任务环境图和任务描述信息,将所述任务环境图和任务描述信息输入视觉语言大模型,分解为多个子任务;根据每个子任务对应的任务描述信息、任务感知空间信息和动作空间信息确定奖励函数,并基于强化学习模型进行训练,以构建相应的子任务模型,所述子任务模型分别用于完成各个子任务;根据多个子任务的操作顺序,依次调用多个子任务模型以执行双臂操作,并采集双臂轨迹数据集,通过模仿学习算法对所述双臂轨迹数据集进行学习,得到双臂操作策略。