一种基于增量学习的深度鲁棒非负矩阵分解方法
申请人信息
- 申请人:成都理工大学
- 申请人地址:610059 四川省成都市成华区二仙桥东三路1号
- 发明人: 成都理工大学
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种基于增量学习的深度鲁棒非负矩阵分解方法 |
| 专利类型 | 发明申请 |
| 申请号 | CN202311679765.8 |
| 申请日 | 2023/12/8 |
| 公告号 | CN117576568A |
| 公开日 | 2024/2/20 |
| IPC主分类号 | G06V20/10 |
| 权利人 | 成都理工大学 |
| 发明人 | 曹昌杰; 李贤; 张涵栎; 罗堂耘; 周冉 |
| 地址 | 四川省成都市成华区二仙桥东三路1号 |
摘要文本
成都理工大学取得“一种透气窗帘布”专利技术,本发明提出一种基于增量学习的深度鲁棒非负矩阵分解方法,即基于l2, 1范数的深度增量非负矩阵分解(l2, 1‑DINMF),用以解决传统NMF无法挖掘SAR目标深层特征的问题。首先,本发明利用深度学习思想构建出全新的NMF模型框架,用于自主学习SAR目标的潜在属性和隐藏信息;同时,通过梯度下降法求得上述模型的近似解,推导出一种收敛速度更快的增量更新算法规则。实验结果表明,随着SAR目标训练样本的数量增长,本发明算法能够显著降低SAR ATR模型的计算复杂度,保障SARATR模型更新的稳定性,还能够在准确率、时间损失和内存空间损失方面始终优于同类非负矩阵分解算法。
专利主权项内容
1.一种基于增量学习的深度鲁棒非负矩阵分解方法,其特征在于,包括以下步骤:步骤1.对现有的图像样本训练数据进行鲁棒非负矩阵分解初始化,得到初始的基矩阵W、特征矩阵H以及对角元素矩阵D,RNMF中,对于一个样本矩阵V∈R,每一列代表一个具有m个像素点的训练样本,共计n个训练样本,将其分解为基矩阵W∈R、特征矩阵H∈R,并得到对角元素矩阵D∈R,在L稀疏限制的条件下的RNMF的损失函数形为:m×nm×rr×nr×r2,1其中a, b代表的是矩阵的行和列,F代表的是损失函数,RNMF的最优解满足约束优化理论的Karush-Kohn-Tucker条件,故约束H>0得到H的KKT条件,公式为:H代表的是特征矩阵中的元素,其中t=1,L, r,b=1,L, n;tb同理得到约束W>0的关于W的KKT条件,公式为:W代表的是基矩阵中的元素,其中a=1, K, m,t=1, K, r;at根据满足KKT条件的解,RNMF的基矩阵W和特征矩阵H有如下的更新规则:其中以上更新规则是交替执行的,即只有特征矩阵H的更新过程复杂时,基矩阵W的元素才在迭代时更新;步骤2.在完成部分训练样本的鲁棒非负矩阵分解初始化,并得到初始的基矩阵W、特征矩阵H和对角矩阵D后,假设初始训练样本集合由n个m维非负列向量组成,用非负矩阵V表示,即其拥有一系列不同的、未知的属性,故构建的层次框架是要满足数据多属性特性的;n基于DNMF理论,提出l-DINMF模型,该模型将非负矩阵V分解为l+1个因式,即:2, 1nV≈WWL WH12ll隐式层次框架为:H≈WHl-1llMH≈WL WH23llH≈WL WH12llV≈WL WH1llW代表的是第k层分解得来的基矩阵,l代表我们将其分解的层数,当样本数达到k个时,损失函数表示为:k其中表示第l层的特征矩阵,W表示第s层的基矩阵,其中s∈1, 2, L, l;sk基于INMF的理论,增加一个新的SAR图像数据不会明显改变所采集的目标样本的基矩阵的值,进而上式被改写为:其中W(s∈1, 2, L, l)表示有k+1样本时第s层的基矩阵,若基矩阵W右上角为k,则代表有k个样本,F代表样本数为k时的损失函数,V代表原始矩阵V中含有k个样本,代表分别分解到每一层时产生的基矩阵W;sk+1sk+1kk当新的训练样本加入模型训练时,通过新样本信息实现l-DINMF算法的计算,完成对基矩阵W的全局更新以及特征矩阵H的局部更新,以实现增量学习,当增加1个样本时,损失函数表示为:2, 1其中v是新增加的SAR图像数据,是特征矩阵/>最后一列数据;k+1令P=I, Q=I0l+1P以及Q来代表损失函数;I均表示单位矩阵,因此将损失函数改写为:s-1s+1F=(V-PWQH)D(V-PWQH)k+1k+1s-1sk+1s+1lk+1sk+1k+1s-1sk+1s+1lk+1T所以,对W求偏导有:sk+1令
代表学习率,则得到W的更新规则:sk+1令G=WW…Wl1k+12k+1lk+1再对求偏导得到:令则得到的更新规则为:l层之前的通过后一层/>与基矩阵/>乘积得到 :
代表特征矩阵/>的最后一列数据,综上所述/>的更新规则为:步骤3.基矩阵W更新完成后,进行训练样本和待识别样本在特征空间中的投影;步骤4.进行了特征提取之后进行分类识别,对训练样本的特征V′进行训练,对待识别样本v′进行分类识别。traintest