一种基于大模型的双臂操作任务学习方法和系统

申请号: CN202410096440.5

申请人: 北京智源人工智能研究院

申请日期: 2024/1/23

摘要文本

本发明公开了一种基于大模型的双臂操作任务学习方法和系统，属于神经网络学习以及机器人技术领域。该方法包括，接收用于双臂操作的任务环境图和任务描述信息，将任务环境图和任务描述信息输入视觉语言大模型，分解为多个子任务；根据每个子任务对应的任务描述信息、任务感知空间信息和动作空间信息确定奖励函数，并基于强化学习模型进行训练，以构建相应的子任务模型，子任务模型分别用于完成各个子任务；根据多个子任务的操作顺序，依次调用多个子任务模型以执行双臂操作，并采集双臂轨迹数据集，通过模仿学习算法对双臂轨迹数据集进行学习，得到双臂操作策略。本发明实现了复杂双臂操作任务的学习，提高了操作策略的鲁棒性。

申请人信息

申请人:北京智源人工智能研究院
申请人地址:100084 北京市海淀区成府路150号5层501号
发明人: 北京智源人工智能研究院

专利详细信息

项目	内容
专利名称	一种基于大模型的双臂操作任务学习方法和系统
专利类型	发明申请
申请号	CN202410096440.5
申请日	2024/1/23
公告号	CN117697763A
公开日	2024/3/15
IPC主分类号	B25J9/16
权利人	北京智源人工智能研究院
发明人	吴天昊
地址	北京市海淀区成府路150号5层501号

专利主权项内容

1.一种基于大模型的双臂操作任务学习方法，其特征在于，包括：接收用于双臂操作的任务环境图和任务描述信息，将所述任务环境图和任务描述信息输入视觉语言大模型，分解为多个子任务；根据每个子任务对应的任务描述信息、任务感知空间信息和动作空间信息确定奖励函数，并基于强化学习模型进行训练，以构建相应的子任务模型，所述子任务模型分别用于完成各个子任务；根据多个子任务的操作顺序，依次调用多个子任务模型以执行双臂操作，并采集双臂轨迹数据集，通过模仿学习算法对所述双臂轨迹数据集进行学习，得到双臂操作策略。

一种基于大模型的双臂操作任务学习方法和系统

摘要文本

申请人信息

专利详细信息

专利主权项内容

热门技术领域

快速入口

专利技术资料

一种基于大模型的双臂操作任务学习方法和系统

摘要文本

申请人信息

专利详细信息

专利主权项内容

相关专利推荐

一种全光产品的质量检测方法及系统

一种3D打印机脱料装置

一种基于试验数据库的压气机性能仿真程序精度评估方法

一种基于灰盒模型的节流阀响应预测方法

一种用于水性工业漆的加工装置

双辐板涡轮盘

热门技术领域

快速入口

专利技术资料