← 返回列表

布局信息生成方法、模型训练方法、装置及电子设备

申请号: CN202311290773.3
申请人: 腾讯科技(深圳)有限公司
更新日期: 2026-03-09

专利详细信息

项目 内容
专利名称 布局信息生成方法、模型训练方法、装置及电子设备
专利类型 发明授权
申请号 CN202311290773.3
申请日 2023/10/8
公告号 CN117036652B
公开日 2024/2/6
IPC主分类号 G06T19/00
权利人 腾讯科技(深圳)有限公司
发明人 蒋征国; 陈皇; 曹浩宇; 姜德强
地址 广东省深圳市南山区高新区科技中一路腾讯大厦35层

摘要文本

腾讯科技(深圳)有限公司取得“一种透气窗帘布”专利技术,本申请实施例提供了一种布局信息生成方法、模型训练方法、装置、电子设备及计算机可读存储介质,可应用于虚拟现实、增强现实、图像处理等领域或场景。该方法包括:确定目标图片的初始布局信息集,初始布局信息集包括相应图片中各文本信息的初始布局信息,初始布局信息包括相应文本信息的类型和待对齐坐标;将目标图片的初始布局信息集输入预先训练的布局生成模型,获得布局生成模型输出的目标图片的已对齐布局信息集,已对齐布局信息集包括相应图片中各文本信息的已对齐布局信息。本申请实施例更贴合与实际的布局生成场景,并且生成的布局质量也更高。 来源:百度搜索专利查询网

专利主权项内容

1.一种布局信息生成方法,其特征在于,包括:确定目标图片的初始布局信息集,所述初始布局信息集包括相应图片中各文本信息的初始布局信息,所述初始布局信息包括相应文本信息的类型和待对齐坐标;将所述目标图片的初始布局信息集输入预先训练的布局生成模型,获得所述布局生成模型输出的所述目标图片的已对齐布局信息集,所述已对齐布局信息集包括相应图片中各文本信息的已对齐布局信息,所述已对齐布局信息包括相应文本信息的类型和基于同一聚类簇的文本信息进行对齐后的对齐坐标;其中,所述布局生成模型是根据至少一个样本图片的初始布局信息集和至少一轮迭代的参考布局信息集训练而成的,每个参考布局信息集包括相应样本图片中各文本信息的参考布局信息,所述参考布局信息为相应文本信息的类型以及基于同一聚类簇的文本信息进行相应轮对齐后的对齐坐标;同一聚类簇的文本信息的布局信息间的相似度符合预设条件。 数据由马 克 数 据整理