← 返回列表

一种图像生成方法、装置、设备及计算机可读存储介质

申请号: CN202311813617.0
申请人: 浪潮电子信息产业股份有限公司
更新日期: 2026-03-09

专利详细信息

项目 内容
专利名称 一种图像生成方法、装置、设备及计算机可读存储介质
专利类型 发明申请
申请号 CN202311813617.0
申请日 2023/12/27
公告号 CN117474796A
公开日 2024/1/30
IPC主分类号 G06T5/70
权利人 浪潮电子信息产业股份有限公司
发明人 张润泽; 李仁刚; 赵雅倩; 郭振华; 范宝余; 刘璐
地址 山东省济南市高新区草山岭南路801号9层东侧

摘要文本

本发明涉及图像生成技术领域,具体公开了一种图像生成方法、装置、设备及计算机可读存储介质,在利用文生图扩散模型对待处理文本进行预设次数的去噪处理的过程中,在每次去噪处理中对生成的中间图像进行图像识别,根据图像识别结果和待处理文本的内容误差更新文生图扩散模型的第一阶段去噪向量,得到第二阶段去噪向量,以第二阶段去噪向量作为本次去噪处理的去噪向量;利用最终的第二阶段去噪向量生成与待处理文本对应的结果图像。通过两阶段去噪,加强了每次去噪过程中对待处理文本中包含的细节信息的把控,由此生成的结果图像可以对待处理文本中包含的细节信息进行精准刻画,从而提高了文本图像模态转换的准确性。

专利主权项内容

1.一种图像生成方法,其特征在于,包括:获取待处理文本;利用文生图扩散模型对所述待处理文本进行预设次数的去噪处理;在每次所述去噪处理中,对中间图像进行图像识别,根据图像识别结果和所述待处理文本的内容误差更新所述文生图扩散模型的第一阶段去噪向量,得到第二阶段去噪向量,以所述第二阶段去噪向量作为本次所述去噪处理的去噪向量;利用最终的所述第二阶段去噪向量生成与所述待处理文本对应的结果图像。