图像生成模型训练方法和装置、图像处理方法和装置

申请号: CN202311755560.3

申请人: 北京百度网讯科技有限公司

申请日期: 2023/12/20

摘要文本

本公开提供了一种图像生成模型训练方法和装置，涉及人工智能技术领域，具体涉及计算机视觉、深度学习、大模型等技术领域，可应用于人工智能的内容生成等场景。具体实现方案为：获取图像样本集；获取预先构建的图像生成网络，图像生成网络包括：依次连接的图文识别模块、大语言模型以及文本生成图像模型；将从图像样本集中选取的图像样本输入图像生成网络，得到图像生成网络输出的生成图像；采用图像评分模型对生成图像进行评分，得到生成图像的评估值；基于评估值，计算图像生成网络的网络损失值；基于图像生成网络的网络损失值，训练图像生成网络，得到经训练的图像生成模型。

申请人信息

申请人:北京百度网讯科技有限公司
申请人地址:100085 北京市海淀区上地十街10号百度大厦2层
发明人: 北京百度网讯科技有限公司

专利详细信息

项目	内容
专利名称	图像生成模型训练方法和装置、图像处理方法和装置
专利类型	发明申请
申请号	CN202311755560.3
申请日	2023/12/20
公告号	CN117745857A
公开日	2024/3/22
IPC主分类号	G06T11/00
权利人	北京百度网讯科技有限公司
发明人	戎康; 宋雨鑫; 张琦; 刘芳龙
地址	北京市海淀区上地十街10号百度大厦2层

专利主权项内容

1.一种图像生成模型训练方法，所述方法包括：获取图像样本集，所述图像样本集包括至少一个图像样本；获取预先构建的图像生成网络，所述图像生成网络包括：依次连接的图文识别模块、大语言模型以及文本生成图像模型，所述图文识别模块基于输入的图像，得到识别文本；所述大语言模型基于识别文本，得到具有多图像描述特征的提示词文本；所述文本生成图像模型基于所述提示词文本，得到生成图像；将从所述图像样本集中选取的图像样本输入所述图像生成网络，得到所述图像生成网络输出的生成图像；采用图像评分模型对所述生成图像进行评分，得到所述生成图像的评估值；基于所述评估值，计算所述图像生成网络的网络损失值；基于所述图像生成网络的网络损失值，训练所述图像生成网络，得到经训练的图像生成模型。。微信公众号马克数据网

图像生成模型训练方法和装置、图像处理方法和装置

摘要文本

申请人信息

专利详细信息

专利主权项内容

热门技术领域

快速入口

专利技术资料

特别鸣谢

图像生成模型训练方法和装置、图像处理方法和装置

摘要文本

申请人信息

专利详细信息

专利主权项内容

相关专利推荐

一种高频变压器串并联倍流输出的整流电路

沙发(HSN-6053)

时延对齐方法及装置

一种高脱色竹制活性碳及其制备工艺

床(HSN-B016)

座椅部件(GF-82733H)

热门技术领域

快速入口

专利技术资料

特别鸣谢