← 返回列表
训练数据生成方法、装置、电子设备和存储介质
申请人信息
- 申请人:书行科技(北京)有限公司
- 申请人地址:100020 北京市朝阳区安定路5号院5号楼18层01单元
- 发明人: 书行科技(北京)有限公司
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 训练数据生成方法、装置、电子设备和存储介质 |
| 专利类型 | 发明申请 |
| 申请号 | CN202311234710.6 |
| 申请日 | 2023/9/22 |
| 公告号 | CN117726897A |
| 公开日 | 2024/3/19 |
| IPC主分类号 | G06V10/774 |
| 权利人 | 书行科技(北京)有限公司 |
| 发明人 | 王浩帆 |
| 地址 | 北京市朝阳区安定路5号院5号楼18层01单元 |
摘要文本
本申请实施例公开了一种训练数据生成方法、装置、电子设备和存储介质。本申请实施例获取样本需求信息,所述样本需求信息包括至少一个样本图像类别;然后,构建所述样本图像类别对应的文本模版,所述文本模版包括所述样本图像类别的至少一种属性信息;接着,对所述属性信息进行扩充,以得到所述样本图像类别对应的至少一个图像描述信息;再基于所述图像描述信息,生成所述图像描述信息对应的样本图像,并确定所述样本图像对应的图像标签信息;再然后,根据所述样本图像和图像标签信息,构建所述样本需求信息对应的训练数据集,以便利用所述训练数据集进行训练。该方案可以有效地提高训练数据生成的效率。
专利主权项内容
1.一种训练数据生成方法,其特征在于,包括:获取样本需求信息,所述样本需求信息包括至少一个样本图像类别;构建所述样本图像类别对应的文本模版,所述文本模版包括所述样本图像类别的至少一种属性信息;对所述属性信息进行扩充,以得到所述样本图像类别对应的至少一个图像描述信息;基于所述图像描述信息,生成所述图像描述信息对应的样本图像,并确定所述样本图像对应的图像标签信息;根据所述样本图像和图像标签信息,构建所述样本需求信息对应的训练数据集,以便利用所述训练数据集进行训练。