基于多模态表征的图像训练数据集生成方法及终端

申请号: CN202410038395.8

申请人: 深圳金三立视频科技股份有限公司

更新日期: 2026-03-17

摘要文本

深圳金三立视频科技股份有限公司取得“一种透气窗帘布”专利技术，本发明公开的基于多模态表征的图像训练数据集生成方法及终端，该方法包括：获取目标文本信息和区域图像；通过预设的语义图像模型根据所述目标文本信息生成目标图像；对所述目标图像进行裁剪得到待检测目标；通过预设的语义分割模型在所述区域图像中确定候选位置；将所述待检测目标贴附至所述候选位置，并对所述待检测目标进行标注，得到目标数据集样本。由同一个待检测目标贴附在多个不同的候选位置中，生成多个不同目标数据集样本，不仅不需要人工生成额外的待检测目标图像，还解决了待检测目标图像难以搜集的问题，提高了用于训练深度学习模型的数据集的多样性，避免由于训练样本匮乏而造成的模型过拟合问题。数据由马克团队整理

专利主权项内容

1.基于多模态表征的图像训练数据集生成方法，其特征在于，包括：获取目标文本信息和区域图像；通过预设的语义图像模型根据所述目标文本信息生成目标图像；对所述目标图像进行裁剪得到待检测目标；通过预设的语义分割模型在所述区域图像中确定候选位置；将所述待检测目标贴附至所述候选位置，并对所述待检测目标进行标注，得到目标数据集样本。

专利申请信息

项目	内容
专利名称	基于多模态表征的图像训练数据集生成方法及终端
专利类型	发明申请
申请号	CN202410038395.8
申请日	2024/1/11
公告号	CN117557880A
公开日	2024/2/13
IPC主分类号	G06V10/774
权利人	深圳金三立视频科技股份有限公司
发明人	张宇; 吴庆耀; 杨伟强; 邓景良; 刘东剑
地址	广东省深圳市龙华区龙华街道清湖社区雪岗北路306号胜立工业园J栋101-5层整栋

基于多模态表征的图像训练数据集生成方法及终端

摘要文本

专利主权项内容

专利申请信息

热门技术领域

快速入口

专利技术资料

基于多模态表征的图像训练数据集生成方法及终端

摘要文本

专利主权项内容

专利申请信息

相关专利推荐

一种智能手表加工阶段的故障溯源方法

一种电池模组及储能系统

一种LED灯带通电测试设备

一种电磁屏蔽衬垫材料的制备方法

一种服务器多背板丝印自适应定位方法、装置及存储介质

车载操作系统及车辆

热门技术领域

快速入口

专利技术资料