一种三维数字人生成和交互方法及系统

申请号: CN202311809947.2

申请人: 南京理工大学

更新日期: 2026-03-09

摘要文本

南京理工大学取得“一种透气窗帘布”专利技术，本发明属于三维重建技术领域，公开了一种三维数字人生成和交互方法及系统。本发明方法包括如下步骤：从单目视频中进行人体实例分割捕捉视频中人体动作；使用神经辐射场重建包含细节的三维数字人形象；采用哈希表编码的方法加速重建；使用扩散模型生成运动序列；通过编辑生成的方式生成任意长度序列；恢复可用于驱动的动作参数；对人脸单独建立三维神经辐射场模型；使用低分辨率特征图和二维神经渲染合成任意视角的二维图像；将脸型、表情等人脸特征映射到一组参数，控制不同参数实现人脸表情驱动和编辑。本发明能够从单目视频快速重建任意的包含精细头像的数字人形象，提供了多样且智能的交互方式。。来自马-克-数-据

专利主权项内容

1.一种三维数字人生成和交互方法，其特征在于，包括如下步骤：步骤1. 数字人生成和交互处理；步骤1.1. 从单目视频中进行人体实例分割，以精准捕捉视频中人体动作；步骤1.2. 使用神经辐射场建立三维人体模板空间下的神经辐射场，包括人体的颜色和几何模型，重建包含细节的三维数字人形象；步骤1.3. 在生成三维数字人形象时，采用哈希表编码的方法加速重建过程；步骤1.4. 使用扩散模型根据输入文本或语音信息生成动作序列，其中，动作序列由预先定义好的若干人体关节点位置表示；步骤1.5. 通过编辑生成的方式生成任意长度动作序列；步骤1.6. 采用基于Transformer的模型恢复用于驱动的动作参数，以驱动数字人模型；步骤1.7 使用多模态数据驱动数字人，以实现数字人的交互；步骤2. 数字头像生成和交互处理；步骤2.1. 对人脸单独建立三维神经辐射场模型；步骤2.2. 使用低分辨率特征图和二维神经渲染合成任意视角的二维图像；步骤2.3. 将人脸特征映射到一组参数，通过控制不同参数实现人脸的表情驱动和编辑。

专利申请信息

项目	内容
专利名称	一种三维数字人生成和交互方法及系统
专利类型	发明授权
申请号	CN202311809947.2
申请日	2023/12/27
公告号	CN117496072B
公开日	2024/3/8
IPC主分类号	G06T17/00
权利人	南京理工大学
发明人	王康侃; 王冲; 李绍园
地址	江苏省南京市玄武区孝陵卫200号

一种三维数字人生成和交互方法及系统

摘要文本

专利主权项内容

专利申请信息

热门技术领域

快速入口

专利技术资料

一种三维数字人生成和交互方法及系统

摘要文本

专利主权项内容

专利申请信息

相关专利推荐

拟无枝酸菌Amycolatopsis sp.MT3及其在降解卤代污染物中的应用

一种可遥控水下采样装置及采样方法

一种露地蔬菜田间自主行走作业控制方法、系统及装备

一种基于腐殖酸淋洗修复重金属污染土壤的设备及方法

一种镁改性炭基磷吸附剂废弃物的多级再利用方法

一种基于多任务学习的自适应广告投放方法及系统

热门技术领域

快速入口

专利技术资料