一种基于模型迁移性评估的任务执行方法、装置及设备
摘要文本
本说明书公开了一种基于模型迁移性评估的任务执行方法、装置及设备。所述方法包括:接收针对待评估模型的迁移性能的评估指令,并确定待评估模型对应的初始参数;获取目标业务场景下的目标数据以及对待评估模型进行预训练时所使用的源样本数据;将目标数据以及源样本数据分别输入待评估模型,基于初始参数,根据目标数据确定待评估模型的特征提取网络对应的主梯度期望值,作为第一主梯度期望值,以及,根据源样本数据确定特征提取网络对应的主梯度期望值,作为第二主梯度期望值;根据第一主梯度期望值以及第二主梯度期望值,确定待评估模型对应迁移性能的评估值,并根据评估值执行任务。。来自马-克-数-据
申请人信息
- 申请人:之江实验室
- 申请人地址:311121 浙江省杭州市余杭区中泰街道科创大道之江实验室
- 发明人: 之江实验室
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种基于模型迁移性评估的任务执行方法、装置及设备 |
| 专利类型 | 发明授权 |
| 申请号 | CN202311722260.5 |
| 申请日 | 2023/12/14 |
| 公告号 | CN117407690B |
| 公开日 | 2024/3/22 |
| IPC主分类号 | G06F18/21 |
| 权利人 | 之江实验室 |
| 发明人 | 程乐超 |
| 地址 | 浙江省杭州市余杭区中泰街道科创大道之江实验室 |
专利主权项内容
1.一种基于模型迁移性评估的任务执行方法,其特征在于,包括:接收针对待评估模型的迁移性能的评估指令,并确定所述待评估模型对应的初始参数;获取目标业务场景下的目标数据以及对所述待评估模型进行预训练时所使用的源样本数据,其中,所述目标业务场景包括:信息推荐场景,所述目标数据包括:用户输入的查询内容,经过迁移后的待评估模型用于根据所述查询内容生成答复语,所述源样本数据为不对业务场景进行区分的广域数据;将所述目标数据以及所述源样本数据分别输入所述待评估模型,基于所述初始参数,根据所述目标数据确定所述待评估模型的特征提取网络对应的主梯度期望值,作为第一主梯度期望值,以及,根据所述源样本数据确定所述特征提取网络对应的主梯度期望值,作为第二主梯度期望值;确定所述特征提取网络在最优参数下的损失值与最优参数和初始参数之间的相关距离、特征提取网络在初始参数下的损失值之间的第一对应关系,令表示模型训练时的最优参数,/>为随机的初始参数,所述第一对应关系为:其中, 为特征提取网络在/>下的损失值/>的一阶偏导数,/>为所述特征提取网络在/>下的损失值,/>,表示所述相关距离;根据所述第一对应关系,确定在所述/>为零的情况下,所述相关距离与所述一阶偏导数之间的第二对应关系,所述第二对应关系为:基于所述第二对应关系,根据所述第一主梯度期望值以及所述第二主梯度期望值,确定所述待评估模型迁移性能的评估值,以根据所述评估值执行任务。