← 返回列表
多任务学习模型构建方法及装置
摘要文本
马 克 数 据 网 本公开提供了一种多任务学习模型构建方法及装置,涉及计算机技术领域。该方法包括:获取预训练的多任务学习模型,该模型包括目标卷积层;在目标卷积层的后边插入目标采样组件,获得插入采样组件的模型,该目标采样组件包括一个或多个第一滤波器;基于插入采样组件的模型对各个任务分别进行训练以获得各个任务对应的各个第一滤波器的训练完成参数,进而根据参数确定各个任务的稀疏网络结构;根据各个任务的稀疏网络结构计算多个任务之间的模型结构相似度,根据模型结构相似度进行模型调整,获得目标多任务学习模型。该方法能够直接获取到任务之间的模型结构相似度,且不会出现参数数量和计算量随任务数膨胀的问题。
申请人信息
- 申请人:北京趋动智能科技有限公司
- 申请人地址:100092 北京市海淀区中关村大街1号10层1022
- 发明人: 北京趋动智能科技有限公司
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 多任务学习模型构建方法及装置 |
| 专利类型 | 发明申请 |
| 申请号 | CN202410064064.1 |
| 申请日 | 2024/1/16 |
| 公告号 | CN117574179A |
| 公开日 | 2024/2/20 |
| IPC主分类号 | G06F18/22 |
| 权利人 | 北京趋动智能科技有限公司 |
| 发明人 | 张君宇; 王鲲; 陈飞; 邹懋 |
| 地址 | 北京市海淀区中关村大街1号10层1022 |
专利主权项内容
1.一种多任务学习模型构建方法,其特征在于,所述方法包括:获取预训练的多任务学习模型;所述预训练的多任务学习模型是对多个任务进行训练获得的,所述预训练的多任务学习模型包括目标卷积层;在所述目标卷积层的后边插入所述目标卷积层对应的目标采样组件,获得插入采样组件的模型;所述目标采样组件包括一个或多个第一滤波器;基于所述插入采样组件的模型对各个任务分别进行训练,获得各个所述任务对应的各个所述第一滤波器的训练完成参数;根据各个所述任务对应的各个所述第一滤波器的训练完成参数分别确定各个所述任务的稀疏网络结构;根据各个所述任务的稀疏网络结构计算所述多个任务之间的模型结构相似度,根据所述模型结构相似度对所述预训练的多任务学习模型进行模型调整,获得目标多任务学习模型。