← 返回列表
基于大模型的图片生成方法、装置、设备和介质
申请人信息
- 申请人:青岛海尔科技有限公司; 青岛海尔智能家电科技有限公司; 海尔优家智能科技(北京)有限公司
- 申请人地址:266101 山东省青岛市崂山区海尔工业园内
- 发明人: 青岛海尔科技有限公司; 青岛海尔智能家电科技有限公司; 海尔优家智能科技(北京)有限公司
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 基于大模型的图片生成方法、装置、设备和介质 |
| 专利类型 | 发明申请 |
| 申请号 | CN202410166499.7 |
| 申请日 | 2024/2/6 |
| 公告号 | CN117710234A |
| 公开日 | 2024/3/15 |
| IPC主分类号 | G06T5/50 |
| 权利人 | 青岛海尔科技有限公司; 青岛海尔智能家电科技有限公司; 海尔优家智能科技(北京)有限公司 |
| 发明人 | 邓邱伟; 王迪; 苏明月; 尹飞; 孙涛; 王中飞 |
| 地址 | 山东省青岛市崂山区海尔工业园内; 山东省青岛市崂山区海尔工业园内; 北京市海淀区知春路106号太平洋国际大厦6层601-606室 |
摘要文本
本申请提供一种基于大模型的图片生成方法、装置、设备和介质,涉及智能家居/智慧家庭技术领域。该方法包括:将第一背景图片和文本描述输入位置预测模型,预测得到第一目标物在第一背景图片的目标位置信息;获取目标图片中与第一目标物相同类型的第二目标物,并根据第二目标物的掩码将第二目标物从目标图片中分割出来;根据目标位置信息中的目标位置尺寸与分割出来的第二目标物之间的大小关系,确认分割出来的第二目标物的缩放比例;根据目标位置信息和缩放比例,将分割出来的第二目标物融合至第一背景图片中。本申请的方法可以将目标产品精准融合到背景图片中。
专利主权项内容
1.一种基于大模型的图片生成方法,其特征在于,包括:将第一背景图片和文本描述输入位置预测模型,预测得到第一目标物在所述第一背景图片的目标位置信息;其中,所述位置预测模型用于获取所述第一背景图片的全局图片特征和所述文本描述的全局文本特征,并根据所述全局图片特征和所述全局文本特征预测所述目标位置信息,所述文本描述用于描述所述第一目标物在所述第一背景图片中的位置;获取目标图片中与所述第一目标物相同类型的第二目标物,并根据所述第二目标物的掩码将所述第二目标物从所述目标图片中分割出来;根据所述目标位置信息中的目标位置尺寸与分割出来的所述第二目标物之间的大小关系,确认分割出来的所述第二目标物的缩放比例;根据所述目标位置信息和所述缩放比例,将分割出来的所述第二目标物融合至所述第一背景图片中。