← 返回列表

图像生成模型训练方法和装置、图像处理方法和装置

申请号: CN202311755560.3
申请人: 北京百度网讯科技有限公司
申请日期: 2023/12/20

摘要文本

本公开提供了一种图像生成模型训练方法和装置,涉及人工智能技术领域,具体涉及计算机视觉、深度学习、大模型等技术领域,可应用于人工智能的内容生成等场景。具体实现方案为:获取图像样本集;获取预先构建的图像生成网络,图像生成网络包括:依次连接的图文识别模块、大语言模型以及文本生成图像模型;将从图像样本集中选取的图像样本输入图像生成网络,得到图像生成网络输出的生成图像;采用图像评分模型对生成图像进行评分,得到生成图像的评估值;基于评估值,计算图像生成网络的网络损失值;基于图像生成网络的网络损失值,训练图像生成网络,得到经训练的图像生成模型。

专利详细信息

项目 内容
专利名称 图像生成模型训练方法和装置、图像处理方法和装置
专利类型 发明申请
申请号 CN202311755560.3
申请日 2023/12/20
公告号 CN117745857A
公开日 2024/3/22
IPC主分类号 G06T11/00
权利人 北京百度网讯科技有限公司
发明人 戎康; 宋雨鑫; 张琦; 刘芳龙
地址 北京市海淀区上地十街10号百度大厦2层

专利主权项内容

1.一种图像生成模型训练方法,所述方法包括:获取图像样本集,所述图像样本集包括至少一个图像样本;获取预先构建的图像生成网络,所述图像生成网络包括:依次连接的图文识别模块、大语言模型以及文本生成图像模型,所述图文识别模块基于输入的图像,得到识别文本;所述大语言模型基于识别文本,得到具有多图像描述特征的提示词文本;所述文本生成图像模型基于所述提示词文本,得到生成图像;将从所述图像样本集中选取的图像样本输入所述图像生成网络,得到所述图像生成网络输出的生成图像;采用图像评分模型对所述生成图像进行评分,得到所述生成图像的评估值;基于所述评估值,计算所述图像生成网络的网络损失值;基于所述图像生成网络的网络损失值,训练所述图像生成网络,得到经训练的图像生成模型。。微信公众号马克 数据网