一种基于模型迁移性评估的任务执行方法、装置及设备

申请号: CN202311722260.5

申请人: 之江实验室

申请日期: 2023/12/14

摘要文本

本说明书公开了一种基于模型迁移性评估的任务执行方法、装置及设备。所述方法包括：接收针对待评估模型的迁移性能的评估指令，并确定待评估模型对应的初始参数；获取目标业务场景下的目标数据以及对待评估模型进行预训练时所使用的源样本数据；将目标数据以及源样本数据分别输入待评估模型，基于初始参数，根据目标数据确定待评估模型的特征提取网络对应的主梯度期望值，作为第一主梯度期望值，以及，根据源样本数据确定特征提取网络对应的主梯度期望值，作为第二主梯度期望值；根据第一主梯度期望值以及第二主梯度期望值，确定待评估模型对应迁移性能的评估值，并根据评估值执行任务。。来自马-克-数-据

申请人信息

申请人:之江实验室
申请人地址:311121 浙江省杭州市余杭区中泰街道科创大道之江实验室
发明人: 之江实验室

专利详细信息

项目	内容
专利名称	一种基于模型迁移性评估的任务执行方法、装置及设备
专利类型	发明授权
申请号	CN202311722260.5
申请日	2023/12/14
公告号	CN117407690B
公开日	2024/3/22
IPC主分类号	G06F18/21
权利人	之江实验室
发明人	程乐超
地址	浙江省杭州市余杭区中泰街道科创大道之江实验室

专利主权项内容

1.一种基于模型迁移性评估的任务执行方法，其特征在于，包括：接收针对待评估模型的迁移性能的评估指令，并确定所述待评估模型对应的初始参数；获取目标业务场景下的目标数据以及对所述待评估模型进行预训练时所使用的源样本数据，其中，所述目标业务场景包括：信息推荐场景，所述目标数据包括：用户输入的查询内容，经过迁移后的待评估模型用于根据所述查询内容生成答复语，所述源样本数据为不对业务场景进行区分的广域数据；将所述目标数据以及所述源样本数据分别输入所述待评估模型，基于所述初始参数，根据所述目标数据确定所述待评估模型的特征提取网络对应的主梯度期望值，作为第一主梯度期望值，以及，根据所述源样本数据确定所述特征提取网络对应的主梯度期望值，作为第二主梯度期望值；确定所述特征提取网络在最优参数下的损失值与最优参数和初始参数之间的相关距离、特征提取网络在初始参数下的损失值之间的第一对应关系，令表示模型训练时的最优参数，/>为随机的初始参数，所述第一对应关系为：其中，为特征提取网络在/>下的损失值/>的一阶偏导数，/>为所述特征提取网络在/>下的损失值，/>，表示所述相关距离；根据所述第一对应关系，确定在所述/>为零的情况下，所述相关距离与所述一阶偏导数之间的第二对应关系，所述第二对应关系为：基于所述第二对应关系，根据所述第一主梯度期望值以及所述第二主梯度期望值，确定所述待评估模型迁移性能的评估值，以根据所述评估值执行任务。

一种基于模型迁移性评估的任务执行方法、装置及设备

摘要文本

申请人信息

专利详细信息

专利主权项内容

热门技术领域

快速入口

专利技术资料

一种基于模型迁移性评估的任务执行方法、装置及设备

摘要文本

申请人信息

专利详细信息

专利主权项内容

相关专利推荐

一种耐磨损塑料模具钢及其制备方法

基于数字化控制的纺织印染废水的节能处理工艺

基于数字化控制的涤纶布料的节水印染系统

一种智能球头、应用方法及车辆

一种碳纤维氧化炉送风与回风分配装置

一种建筑整体保温性能检测主体及其检测方法

热门技术领域

快速入口

专利技术资料