← 返回列表

数据处理方法、装置、电子设备及介质

申请号: CN202310318977.7
申请人: 书行科技(北京)有限公司
更新日期: 2026-03-09

专利详细信息

项目 内容
专利名称 数据处理方法、装置、电子设备及介质
专利类型 发明申请
申请号 CN202310318977.7
申请日 2023/3/29
公告号 CN117725498A
公开日 2024/3/19
IPC主分类号 G06F18/2413
权利人 书行科技(北京)有限公司
发明人 王希予
地址 北京市朝阳区安定路5号院5号楼18层01单元

摘要文本

本申请实施例公开了数据处理方法、装置、电子设备及介质,可应用于数据处理技术领域。其中方法包括:获取第二分类模型,并对第二分类模型所对应的分类类别增加第一目标类别;获取每个初始类别下的第一样本数据对应的中心样本数据,每个中心样本数据是指对应的第一全局特征与所属的初始类别的平均全局特征之间的特征距离最小的第一样本数据;获取第二样本数据集合;基于多个第二样本数据以及N个初始类别对应的中心样本数据对增加分类类别的第二分类模型进行迭代训练,得到第三分类模型,并利用第三分类模型对输入的数据进行分类识别。采用本申请实施例,有助于在不依赖于大量旧任务数据的同时,提升基于增量学习训练得到的模型的模型性能。

专利主权项内容

1.一种数据处理方法,其特征在于,所述方法包括:获取第二分类模型,并对所述第二分类模型所对应的分类类别增加第一目标类别;所述第二分类模型是基于第一样本数据集合对第一分类模型进行训练得到的,所述第二分类模型对应的分类类别包括N个初始类别,所述N个初始类别不同于所述第一目标类别;所述第一样本数据集合包括所述N个初始类别下的多个第一样本数据;N为正整数;获取每个初始类别下的第一样本数据对应的中心样本数据,每个中心样本数据是指对应的第一全局特征与所属的初始类别的平均全局特征之间的特征距离最小的第一样本数据,每个第一样本数据的第一全局特征是基于分类模型的编码器对所述每个第一样本数据进行特征编码得到的,每个初始类别的平均全局特征是指对应的多个第一样本数据的第一全局特征的平均特征;获取第二样本数据集合,所述第二样本数据集合中包括多个第二样本数据,每个第二样本数据均属于所述第一目标类别;基于所述多个第二样本数据以及所述N个初始类别对应的中心样本数据对增加分类类别的第二分类模型进行迭代训练,得到第三分类模型,并利用所述第三分类模型对输入的数据进行分类识别;所述第三分类模型对应的分类类别包括所述N个初始类别和所述第一目标类别。