← 返回列表

图像生成方法、模型训练方法、装置及电子设备

申请号: CN202410225428.X
申请人: 腾讯科技(深圳)有限公司
更新日期: 2026-03-17

专利详细信息

项目 内容
专利名称 图像生成方法、模型训练方法、装置及电子设备
专利类型 发明申请
申请号 CN202410225428.X
申请日 2024/2/29
公告号 CN117808854A
公开日 2024/4/2
IPC主分类号 G06T7/33
权利人 腾讯科技(深圳)有限公司
发明人 叶虎
地址 广东省深圳市南山区高新区科技中一路腾讯大厦35层

摘要文本

本申请实施例公开了一种图像生成方法、模型训练方法、装置及电子设备,通过对原始脸部图像进行第一编码得到脸部标识特征,进行第二编码得到脸部结构特征,将脸部标识特征与脸部结构特征融合得到脸部融合特征,接着将脸部标识特征映射得到第一脸部映射特征,将目标内容特征与第一脸部映射特征拼接得到第一拼接特征,将脸部融合特征以及第一拼接特征输入至扩散模型,利用基于脸部融合特征以及第一拼接特征构建的注意力机制进行扩散处理,能够结合原始脸部图像以及目标内容生成目标脸部图像,从而有效地提升原始脸部图像中的脸部与目标脸部图像中的脸部之间的一致性,可广泛应用于云技术、人工智能、智慧交通等场景。

专利主权项内容

1.一种图像生成方法,其特征在于,包括:获取原始脸部图像,对所述原始脸部图像进行第一编码,得到所述原始脸部图像的脸部标识特征,对所述原始脸部图像进行第二编码,得到所述原始脸部图像的脸部结构特征;将所述脸部标识特征与所述脸部结构特征进行融合,得到脸部融合特征;获取目标内容的目标内容特征,对所述脸部标识特征进行映射,得到第一脸部映射特征,将所述目标内容特征与所述第一脸部映射特征进行拼接,得到第一拼接特征;将所述脸部融合特征以及所述第一拼接特征输入至扩散模型,利用基于所述脸部融合特征以及所述第一拼接特征构建的注意力机制进行扩散处理,生成目标脸部图像。