一种具有风格个性化的图像生成方法、装置及存储介质

申请号: CN202410217621.9

申请人: 南京邮电大学

申请日期: 2024/2/28

摘要文本

本发明公开了人工智能技术领域的一种具有风格个性化的图像生成方法、装置及存储介质，旨在解决图像生成的质量与准确性的技术问题。所述方法包括：选取风格图像，将其输入预构建的VGG19_f3网络模型中，获得不同大小特征图；计算特征图的Gram矩阵，以提取出特征图的风格信息；将经过文本编码器得到的文本的编码、噪音图像、风格信息输入预构建的具有风格引导模块的噪音预测网络进行噪音预测，获得预测噪音并对噪音图像进行重复去噪，获得潜空间图像，以及将其通过图像解码器进行解码，获得最终生成风格个性化图像。本发明能够使模型端到端生成风格个性化图像，使模型具有更强的风格个性化能力，同时保证生成图像的质量以及准确性。。数据由马克团队整理

申请人信息

申请人:南京邮电大学
申请人地址:210003 江苏省南京市鼓楼区新模范马路66号
发明人: 南京邮电大学

专利详细信息

项目	内容
专利名称	一种具有风格个性化的图像生成方法、装置及存储介质
专利类型	发明申请
申请号	CN202410217621.9
申请日	2024/2/28
公告号	CN117788629A
公开日	2024/3/29
IPC主分类号	G06T11/00
权利人	南京邮电大学
发明人	徐小龙; 许逸非
地址	江苏省南京市鼓楼区新模范马路66号

专利主权项内容

1.一种具有风格个性化的图像生成方法，其特征在于，包括：选取风格图像，将所述风格图像输入预构建的VGG19_f3网络模型中，获得不同大小的特征图；计算所述特征图的Gram矩阵，以提取出所述特征图的风格信息；将经过文本编码器得到的文本的编码、随机采样的噪音图像、风格信息输入预构建的具有风格引导模块的噪音预测网络中进行噪音预测，获得预测噪音；利用所述预测噪音对所述噪音图像进行重复的去噪操作，获得潜空间图像；将所述潜空间图像通过大型图像生成模型中的图像解码器进行解码，获得最终生成的风格个性化图像。

一种具有风格个性化的图像生成方法、装置及存储介质

摘要文本

申请人信息

专利详细信息

专利主权项内容

热门技术领域

快速入口

专利技术资料

特别鸣谢

一种具有风格个性化的图像生成方法、装置及存储介质

摘要文本

申请人信息

专利详细信息

专利主权项内容

相关专利推荐

一种用于分布式光伏方法发电的优化配置方法及系统

一种靶向热休克蛋白90的特异性肿瘤诊断探针和显像剂

企业数字化运营多维数据分析方法及系统

用于感知网络中边缘节点健康状态的方法、设备和介质

一种音频信息内容识别方法

一种输水隧洞水下检测机器人及使用方法

热门技术领域

快速入口

专利技术资料

特别鸣谢