基于级联注意力的单流单阶段网络目标跟踪方法与系统
申请人信息
- 申请人:南昌工程学院
- 申请人地址:330000 江西省南昌市高新区天祥大道289号
- 发明人: 南昌工程学院
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 基于级联注意力的单流单阶段网络目标跟踪方法与系统 |
| 专利类型 | 发明申请 |
| 申请号 | CN202410106560.9 |
| 申请日 | 2024/1/25 |
| 公告号 | CN117649582A |
| 公开日 | 2024/3/5 |
| IPC主分类号 | G06V10/80 |
| 权利人 | 南昌工程学院 |
| 发明人 | 王员云; 司英振 |
| 地址 | 江西省南昌市高新区天祥大道289号 |
摘要文本
本发明提出一种基于级联注意力的单流单阶段网络目标跟踪方法与系统,该方法包括,首先构成单流单阶段整体模型,将模板图像以及搜索图片输入至单流单阶段整体模型中,进行特征提取获取局部特征信息,并利用级联注意力对局部语义信息进行聚合以实现特征增强,再进行交叉注意力计算以实现通信,获得结果特征图,将结果特征图采用迭代的方式重复提取若干次,得到最终的结果特征图以预测目所在位置和目标状态,并根据目标所在位置实现目标跟踪,同时根据目标状态确定是否将所预测的目标状态作为下一阶段在线跟踪过程中的在线模板。本发明再减少多头注意力的计算冗余的同时可以在复杂场景中应对对象外观的变化,进而提高目标跟踪的性能。
专利主权项内容
1.一种基于级联注意力的单流单阶段网络目标跟踪方法,其特征在于,所述方法包括如下步骤:步骤1、在单流单阶段框架下,基于Transformer网络模型以及特征增强模块,构建得到主干特征提取与融合模块,主干特征提取与融合模块、头部角点模块、和分数头部预测模块构成单流单阶段整体模型;步骤2、获取模板图像以及搜索图片,模板图像包括包含有若干所需跟踪目标的初始模板和若干包含目标状态的在线模板;步骤3、将模板图像以及搜索图片输入至单流单阶段整体模型中,通过主干特征提取与融合模块提取模板图像以及搜索图片对应的局部特征信息;将局部特征信息输入特征增强模块中,利用级联注意力对局部语义信息进行聚合以实现特征增强,得到模板图像和搜索图片的全局上下文信息;对模板图像和搜索图片的全局上下文信息进行交叉注意力计算以实现通信,获得结果特征图;步骤4、将结果特征图分割为模板图像和搜索图片,并作为下一阶段的输入,采用迭代的方式重复步骤3若干次,得到最终的结果特征图;步骤5、将最终的结果特征图输入头部角点模块中预测每个目标位置的置信度得分,并根据置信度得分确定跟踪目标所在位置以实现目标跟踪;并将结果特征图输入分数头部预测模块中,以预测每个目标状态的置信度得分,根据目标状态的置信度得分来确定是否将所预测的目标状态作为下一阶段在线跟踪过程中的在线模板;步骤6、利用大规模数据集为基础重复步骤2至步骤4,对单流单阶段整体模型进行预训练以优化模型参数;步骤7、利用训练好的单流单阶段整体模型对视频序列进行目标在线跟踪。