← 返回列表

基于大模型生成图像的文本调整方法、装置、存储介质

申请号: CN202410173841.6
申请人: 青岛海尔科技有限公司; 青岛海尔智能家电科技有限公司; 海尔优家智能科技(北京)有限公司
更新日期: 2026-03-16

专利详细信息

项目 内容
专利名称 基于大模型生成图像的文本调整方法、装置、存储介质
专利类型 发明申请
申请号 CN202410173841.6
申请日 2024/2/7
公告号 CN117746214A
公开日 2024/3/22
IPC主分类号 G06V10/86
权利人 青岛海尔科技有限公司; 青岛海尔智能家电科技有限公司; 海尔优家智能科技(北京)有限公司
发明人 田云龙; 苏明月; 王迪; 王淼; 徐静; 牛丽; 黄媛媛
地址 山东省青岛市崂山区海尔路1号海尔工业园; 山东省青岛市崂山区海尔工业园内; 北京市海淀区知春路106号太平洋国际大厦6层601-606室

摘要文本

本申请公开了一种基于大模型生成图像的文本调整方法、装置、存储介质,涉及智慧家庭技术领域,该基于大模型生成图像的文本调整包括:获取第一数据组集合;将第一数据组集合对应的多个原始图像输入至生成文本模型中,得到与每一个原始图像对应的目标文本,其中,生成文本模型为通过预设训练机制确定出的用于根据图像自动生成预设文本结构的模型;确定目标文本与每一个原始图像对应的目标原始文本之间的差异信息;根据差异信息对目标原始文本进行文本调整,得到修正文本,其中,修正文本用于指示对目标原始文本进行调整后的文本。解决无法确定如何修改输入的文本描述来得到期望的生成图像效果的技术问题,进而能够提高得到期望的生成图像的效率。

专利主权项内容

1.一种基于大模型生成图像的文本调整方法,其特征在于,包括:获取第一数据组集合,其中,所述第一数据组集合中的每个数据组均包括原始文本,所述原始文本对应的原始图像;所述原始文本用于描述所述原始图像中包含的N个目标物体以及所述N个目标物体对应的属性信息,N为正整数;将所述第一数据组集合对应的多个原始图像输入至生成文本模型中,得到与每一个原始图像对应的目标文本,其中,所述生成文本模型为通过预设训练机制确定出的用于根据图像自动生成预设文本结构的模型;确定所述目标文本与所述每一个原始图像对应的目标原始文本之间的差异信息;根据所述差异信息对所述目标原始文本进行文本调整,得到修正文本。