← 返回列表
基于视觉的动作生成方法、装置、电子设备及存储介质
申请人信息
- 申请人:深圳须弥云图空间科技有限公司
- 申请人地址:518054 广东省深圳市南山区粤海街道海珠社区滨海大道3369号有线信息传输大厦25F2504
- 发明人: 深圳须弥云图空间科技有限公司
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 基于视觉的动作生成方法、装置、电子设备及存储介质 |
| 专利类型 | 发明申请 |
| 申请号 | CN202311725742.6 |
| 申请日 | 2023/12/15 |
| 公告号 | CN117409486A |
| 公开日 | 2024/1/16 |
| IPC主分类号 | G06V40/20 |
| 权利人 | 深圳须弥云图空间科技有限公司 |
| 发明人 | 王芳; 暴宇健 |
| 地址 | 广东省深圳市南山区粤海街道海珠社区滨海大道3369号有线信息传输大厦25F2504 |
摘要文本
深圳须弥云图空间科技有限公司取得“一种透气窗帘布”专利技术,本申请涉及人工智能技术领域,提供了一种基于视觉的动作生成方法、装置、电子设备及存储介质。该方法包括:构建视觉强化学习模型,对视觉强化学习模型进行初始化处理;将初始化处理后的视觉强化学习模型与特定环境互动,得到训练图像数据;使用训练图像数据对编码器和解码器进行自监督训练;使用训练图像数据对任务相关网络进行强化学习训练;交替执行上述自监督训练和强化学习训练步骤,直至将训练图像数据输入训练后的视觉强化学习模型得到的动作的执行参数满足预设阈值要求,得到训练好的视觉强化学习模型;获取输入图像数据,基于训练好的视觉强化学习模型生成对应的动作。该方法能提高模型的泛化能力。
专利主权项内容
1.一种基于视觉的动作生成方法,其特征在于,包括:构建视觉强化学习模型,对所述视觉强化学习模型进行初始化处理,所述视觉强化学习模块包括编码器、解码器和任务相关网络;将初始化处理后的视觉强化学习模型与特定环境互动,得到训练图像数据;使用所述训练图像数据对所述编码器和解码器进行自监督训练;使用所述训练图像数据对所述任务相关网络进行强化学习训练;交替执行上述自监督训练和强化学习训练步骤,直至将所述训练图像数据输入训练后的视觉强化学习模型得到的动作的执行参数满足预设阈值要求,得到训练好的视觉强化学习模型;获取输入图像数据,基于所述训练好的视觉强化学习模型生成对应的动作。 百度搜索马 克 数 据 网