← 返回列表

基于预训练语言模型的三维场景生成方法及相关组件

申请号: CN202311811992.1
申请人: 浪潮电子信息产业股份有限公司
更新日期: 2026-03-09

专利详细信息

项目 内容
专利名称 基于预训练语言模型的三维场景生成方法及相关组件
专利类型 发明申请
申请号 CN202311811992.1
申请日 2023/12/27
公告号 CN117475089A
公开日 2024/1/30
IPC主分类号 G06T17/00
权利人 浪潮电子信息产业股份有限公司
发明人 杜国光; 范宝余; 赵雅倩; 王丽; 郭振华; 李仁刚
地址 山东省济南市高新区草山岭南路801号9层东侧

摘要文本

本申请公开了一种基于预训练语言模型的三维场景生成方法及相关组件,涉及人工智能领域,解决现有三维场景生成精度低的问题。该方案通过获取用户输入的第一文本描述信息,对其进行解析,得到场景空间信息和三维物体的第二文本描述信息,可以更精确地了解目标三维场景的要求和构成;根据解析得到的信息生成三维场景空间布局,并根据第二文本描述信息生成相应的三维物体数据,最后通过融合得到最终的目标三维场景。本申请采用分而治之的思想,更注重对第一文本描述信息的解析和理解,将其分解为多个细节,并通过分步骤生成场景空间布局和三维物体的三维物体数据,最后再将其融合,使最终得到的目标三维场景的细节更准确。

专利主权项内容

1.一种基于预训练语言模型的三维场景生成方法,其特征在于,包括:获取用户输入的第一文本描述信息,基于预训练语言模型对所述第一文本描述信息进行解析,得到场景空间信息和多个三维物体的第二文本描述信息,目标三维场景中包括场景空间和所述场景空间中的多个所述三维物体;根据各所述第二文本描述信息生成与各所述三维物体对应的三维物体数据;根据所述场景空间信息和所述第二文本描述信息生成三维场景空间布局,所述三维场景空间布局包括各个所述三维物体在所述场景空间中的空间位置;将所述三维场景空间布局和所述三维物体数据融合,得到所述目标三维场景。