← 返回列表

数据增强模型训练及数据处理方法、装置、设备、介质

申请号: CN202410098587.8
申请人: 腾讯科技(深圳)有限公司
更新日期: 2026-03-17

专利详细信息

项目 内容
专利名称 数据增强模型训练及数据处理方法、装置、设备、介质
专利类型 发明申请
申请号 CN202410098587.8
申请日 2024/1/24
公告号 CN117648576A
公开日 2024/3/5
IPC主分类号 G06F18/214
权利人 腾讯科技(深圳)有限公司
发明人 陈煜钊
地址 广东省深圳市南山区高新区科技中一路腾讯大厦35层

摘要文本

本申请提供了一种数据增强模型训练及数据处理方法、装置、设备、介质;方法包括:通过预设的源域模型,确定源域预估概率,并通过待训练的目标域模型的目标映射层和增强映射层,确定第一目标域预估概率和第一目标域增强概率;基于源域预估概率和第一目标域预估概率,确定源域样本数据的源域校准标签;通过待训练的目标域模型的目标映射层和增强映射层,确定第二目标预估概率和第二目标域增强概率;通过待训练的目标域模型的集成模块,确定集成预估概率;基于源域校准标签、目标域样本数据的目标域标签、第一目标域增强概率和集成预估概率,对待训练的目标域模型进行模型训练,得到数据增强模型。通过本申请,能够提升数据增强模型的模型性能。。来自马-克-数-据

专利主权项内容

1.一种数据增强模型训练方法,其特征在于,所述方法包括:获取源域样本数据和目标域样本数据;通过预设的源域模型,对所述源域样本数据进行前向传播,得到源域预估概率,并通过待训练的目标域模型的目标映射层和增强映射层,分别对所述源域样本数据进行前向传播,得到第一目标域预估概率和第一目标域增强概率;基于所述源域预估概率和所述第一目标域预估概率,对所述源域样本数据的源域标签进行标签校准,得到所述源域样本数据的源域校准标签;通过所述待训练的目标域模型的所述目标映射层和所述增强映射层,分别对所述目标域样本数据进行前向传播,得到第二目标预估概率和第二目标域增强概率;通过所述待训练的目标域模型的集成模块,对所述第二目标预估概率和所述第二目标域增强概率进行概率集成处理,得到集成预估概率;基于所述源域校准标签、所述目标域样本数据的目标域标签、所述第一目标域增强概率和所述集成预估概率,对所述待训练的目标域模型进行模型训练,得到数据增强模型。