← 返回列表
一种基于知识蒸馏的行人搜索模型压缩方法
摘要文本
本发明公开了一种基于知识蒸馏的行人搜索模型压缩方法,压缩方法包括如下步骤:S1:大型行人搜索网络结构作为教师模型,在行人搜索数据集上与训练教师模型;S2:轻量行人搜索网络结构作为学生模型;S3:在行人搜索数据集上训练学生模型时,从教师模型获取第一输出数据,从学生模型第二输出数据;S4:使用行人搜索模型压缩方法解耦蒸馏第一数据输出中的知识,计算解耦蒸馏损失;S5:联合行人搜索任务损失和解耦蒸馏损失训练学生模型,提高所述学生模型的性能。本发明针对图像特征和行人搜索任务的特点设计压缩方法,将大型行人搜索模型的有益知识转移到轻量模型中,有利于在真实监控场景中部署高精确度的轻量行人搜索模型。
申请人信息
- 申请人:南京航空航天大学
- 申请人地址:210016 江苏省南京市秦淮区御道街29号
- 发明人: 南京航空航天大学
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种基于知识蒸馏的行人搜索模型压缩方法 |
| 专利类型 | 发明申请 |
| 申请号 | CN202410090297.9 |
| 申请日 | 2024/1/23 |
| 公告号 | CN117612214A |
| 公开日 | 2024/2/27 |
| IPC主分类号 | G06V40/10 |
| 权利人 | 南京航空航天大学 |
| 发明人 | 秦杰; 贾亦真; 权荣; 陈海燕 |
| 地址 | 江苏省南京市秦淮区御道街29号 |
专利主权项内容
1.一种基于知识蒸馏的行人搜索模型压缩方法,其特征在于,包括如下步骤:步骤S1:获取教师模型,在行人搜索数据集上训练所述教师模型,通过行人搜索任务损失更新所述教师模型的网络参数,得到训练好的教师模型;步骤S2:获取学生模型,在行人搜索数据集上训练所述学生模型,在训练时,从训练好的教师模型获取第一输出数据,从所述学生模型获取第二输出数据;步骤S3:解耦蒸馏所述第一输出数据中的知识,度量第一输出数据中知识和第二输出数据中知识的差异,并计算解耦蒸馏损失;步骤S4:联合所述行人搜索任务损失和所述解耦蒸馏损失更新学生模型的网络参数,最终得到训练好的学生模型,将训练好的学生模型用于行人搜索任务。