← 返回列表
图像生成模型训练方法和装置、图像处理方法和装置
摘要文本
本公开提供了一种图像生成模型训练方法和装置,涉及人工智能技术领域,具体涉及计算机视觉、深度学习、大模型等技术领域,可应用于人工智能的内容生成等场景。具体实现方案为:获取图像样本集;获取预先构建的图像生成网络,图像生成网络包括:依次连接的图文识别模块、大语言模型以及文本生成图像模型;将从图像样本集中选取的图像样本输入图像生成网络,得到图像生成网络输出的生成图像;采用图像评分模型对生成图像进行评分,得到生成图像的评估值;基于评估值,计算图像生成网络的网络损失值;基于图像生成网络的网络损失值,训练图像生成网络,得到经训练的图像生成模型。
申请人信息
- 申请人:北京百度网讯科技有限公司
- 申请人地址:100085 北京市海淀区上地十街10号百度大厦2层
- 发明人: 北京百度网讯科技有限公司
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 图像生成模型训练方法和装置、图像处理方法和装置 |
| 专利类型 | 发明申请 |
| 申请号 | CN202311755560.3 |
| 申请日 | 2023/12/20 |
| 公告号 | CN117745857A |
| 公开日 | 2024/3/22 |
| IPC主分类号 | G06T11/00 |
| 权利人 | 北京百度网讯科技有限公司 |
| 发明人 | 戎康; 宋雨鑫; 张琦; 刘芳龙 |
| 地址 | 北京市海淀区上地十街10号百度大厦2层 |
专利主权项内容
1.一种图像生成模型训练方法,所述方法包括:获取图像样本集,所述图像样本集包括至少一个图像样本;获取预先构建的图像生成网络,所述图像生成网络包括:依次连接的图文识别模块、大语言模型以及文本生成图像模型,所述图文识别模块基于输入的图像,得到识别文本;所述大语言模型基于识别文本,得到具有多图像描述特征的提示词文本;所述文本生成图像模型基于所述提示词文本,得到生成图像;将从所述图像样本集中选取的图像样本输入所述图像生成网络,得到所述图像生成网络输出的生成图像;采用图像评分模型对所述生成图像进行评分,得到所述生成图像的评估值;基于所述评估值,计算所述图像生成网络的网络损失值;基于所述图像生成网络的网络损失值,训练所述图像生成网络,得到经训练的图像生成模型。。微信公众号马克 数据网