← 返回列表

一种图像生成方法及装置

申请号: CN202410156973.8
申请人: 支付宝(杭州)信息技术有限公司
申请日期: 2024/2/4

摘要文本

本说明书一个或多个实施例公开了一种图像生成方法及装置,该方法首先获取目标主体的前景图像以及目标主体所在的待确定的目标图像的文本描述信息,该目标图像中包括目标主体的前景图像和背景图像,其次,从目标主体的前景图像中分别提取目标主体的类别表征信息和风格表征信息,然后将所提取的类别表征信息和风格表征信息输入预先训练的前景控制模型中,得到目标主体的前景控制信息,最后,通过扩散模型,根据目标图像的文本描述信息和前景控制信息,并通过对目标主体的前景图像添加噪声信息的方式,确定目标主体对应的目标图像。

专利详细信息

项目 内容
专利名称 一种图像生成方法及装置
专利类型 发明申请
申请号 CN202410156973.8
申请日 2024/2/4
公告号 CN117710510A
公开日 2024/3/15
IPC主分类号 G06T11/00
权利人 支付宝(杭州)信息技术有限公司
发明人 洪燕; 兰钧; 祝慧佳; 王维强
地址 浙江省杭州市西湖区西溪路556号8层B段801-11

专利主权项内容

1.一种图像生成方法,包括:获取目标主体的前景图像以及所述目标主体所在的待确定的目标图像的文本描述信息,所述目标图像中包括所述目标主体的前景图像和背景图像;从所述目标主体的前景图像中分别提取所述目标主体的类别表征信息和风格表征信息;将所述目标主体的类别表征信息和风格表征信息输入预先训练的前景控制模型中,得到所述目标主体的前景控制信息,所述前景控制模型是用于对所述目标主体的类别表征信息进行重构采样处理以确定对应的风格表征信息的模型;通过扩散模型,根据所述目标图像的文本描述信息和前景控制信息,并通过对所述目标主体的前景图像添加噪声信息的方式,确定所述目标主体对应的目标图像。