← 返回列表
一种具有风格个性化的图像生成方法、装置及存储介质
摘要文本
本发明公开了人工智能技术领域的一种具有风格个性化的图像生成方法、装置及存储介质,旨在解决图像生成的质量与准确性的技术问题。所述方法包括:选取风格图像,将其输入预构建的VGG19_f3网络模型中,获得不同大小特征图;计算特征图的Gram矩阵,以提取出特征图的风格信息;将经过文本编码器得到的文本的编码、噪音图像、风格信息输入预构建的具有风格引导模块的噪音预测网络进行噪音预测,获得预测噪音并对噪音图像进行重复去噪,获得潜空间图像,以及将其通过图像解码器进行解码,获得最终生成风格个性化图像。本发明能够使模型端到端生成风格个性化图像,使模型具有更强的风格个性化能力,同时保证生成图像的质量以及准确性。。数据由马 克 团 队整理
申请人信息
- 申请人:南京邮电大学
- 申请人地址:210003 江苏省南京市鼓楼区新模范马路66号
- 发明人: 南京邮电大学
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种具有风格个性化的图像生成方法、装置及存储介质 |
| 专利类型 | 发明申请 |
| 申请号 | CN202410217621.9 |
| 申请日 | 2024/2/28 |
| 公告号 | CN117788629A |
| 公开日 | 2024/3/29 |
| IPC主分类号 | G06T11/00 |
| 权利人 | 南京邮电大学 |
| 发明人 | 徐小龙; 许逸非 |
| 地址 | 江苏省南京市鼓楼区新模范马路66号 |
专利主权项内容
1.一种具有风格个性化的图像生成方法,其特征在于,包括:选取风格图像,将所述风格图像输入预构建的VGG19_f3网络模型中,获得不同大小的特征图;计算所述特征图的Gram矩阵,以提取出所述特征图的风格信息;将经过文本编码器得到的文本的编码、随机采样的噪音图像、风格信息输入预构建的具有风格引导模块的噪音预测网络中进行噪音预测,获得预测噪音;利用所述预测噪音对所述噪音图像进行重复的去噪操作,获得潜空间图像;将所述潜空间图像通过大型图像生成模型中的图像解码器进行解码,获得最终生成的风格个性化图像。