← 返回列表

训练数据生成方法、装置、电子设备和存储介质

申请号: CN202311234710.6
申请人: 书行科技(北京)有限公司
更新日期: 2026-03-09

专利详细信息

项目 内容
专利名称 训练数据生成方法、装置、电子设备和存储介质
专利类型 发明申请
申请号 CN202311234710.6
申请日 2023/9/22
公告号 CN117726897A
公开日 2024/3/19
IPC主分类号 G06V10/774
权利人 书行科技(北京)有限公司
发明人 王浩帆
地址 北京市朝阳区安定路5号院5号楼18层01单元

摘要文本

本申请实施例公开了一种训练数据生成方法、装置、电子设备和存储介质。本申请实施例获取样本需求信息,所述样本需求信息包括至少一个样本图像类别;然后,构建所述样本图像类别对应的文本模版,所述文本模版包括所述样本图像类别的至少一种属性信息;接着,对所述属性信息进行扩充,以得到所述样本图像类别对应的至少一个图像描述信息;再基于所述图像描述信息,生成所述图像描述信息对应的样本图像,并确定所述样本图像对应的图像标签信息;再然后,根据所述样本图像和图像标签信息,构建所述样本需求信息对应的训练数据集,以便利用所述训练数据集进行训练。该方案可以有效地提高训练数据生成的效率。

专利主权项内容

1.一种训练数据生成方法,其特征在于,包括:获取样本需求信息,所述样本需求信息包括至少一个样本图像类别;构建所述样本图像类别对应的文本模版,所述文本模版包括所述样本图像类别的至少一种属性信息;对所述属性信息进行扩充,以得到所述样本图像类别对应的至少一个图像描述信息;基于所述图像描述信息,生成所述图像描述信息对应的样本图像,并确定所述样本图像对应的图像标签信息;根据所述样本图像和图像标签信息,构建所述样本需求信息对应的训练数据集,以便利用所述训练数据集进行训练。