一种基于3D生成对抗网络的域适应行人重识别方法
申请人信息
- 申请人:南京视察者智能科技有限公司
- 申请人地址:210014 江苏省南京市秦淮区永智路6号南京白下高新技术产业园区四号楼A栋102室
- 发明人: 南京视察者智能科技有限公司
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种基于3D生成对抗网络的域适应行人重识别方法 |
| 专利类型 | 发明申请 |
| 申请号 | CN202211002114.0 |
| 申请日 | 2022/8/20 |
| 公告号 | CN117649677A |
| 公开日 | 2024/3/5 |
| IPC主分类号 | G06V40/10 |
| 权利人 | 南京视察者智能科技有限公司 |
| 发明人 | 姜峰; 周金明 |
| 地址 | 江苏省南京市秦淮区永智路6号南京白下高新技术产业园区四号楼A栋102室 |
摘要文本
本发明公开了一种基于3D生成对抗网络的域适应行人重识别方法,该方法主要包括在视频数据中通过对行人进行检测和跟踪,获取行人的图片序列;将行人序列图片输入到3D‑GAN模型中;图片序列经过编码器后得到特征序列,在特征序列中加入随机高斯噪声和随机方向序列,改变特征序列的分布;将变化后的特征序列作为解码器的输入,将原始图片序列和生成的图片序列一起输入到判别器中,对应两个输出;设定3D‑GAN模型的训练机制是使得判别器和生成器两者对抗直到达成平衡;通过使用3D‑GAN实现跨域数据的生成,获得目标域丰富的特征信息,提高了模型域自适应能力。 关注微信公众号专利查询网
专利主权项内容
1.一种基于3D生成对抗网络的域适应行人重识别方法,其特征在于,该方法主要包括以下步骤:步骤1,在视频数据中通过对行人进行检测和跟踪,获取行人的图片序列I,其维度为H×W×S,其中H和W分别为行人图片的高和宽,S为序列数量;real步骤2,将行人序列图片I输入到3D-GAN模型中,3D-GAN模型由一个生成器G和一个判别器D组成,生成器G包含一个编码器和一个解码器,编码器由4个3D卷积层和3个3D下采样层组成,用于从序列图片中提取行人的共性特征,为后面解码器生成跨域数据做准备;real步骤3,图片序列经过编码器后得到特征序列,在特征序列中加入随机高斯噪声z和随机方向序列d,改变特征序列的分布,形成域变化的条件;随机方向序列d通过在每个序列通道上加入随机生成的空间坐标来影响特征序列的变化;randrandrand步骤4,将变化后的特征序列作为解码器的输入,解码器由4个3D反卷积层和3个3D上采样层组成,用于将特征序列还原成图像序列,在编码器和解码器之间使用跳跃连接,生成的图片序列I为:I=G(I, z, d);gengenrealrandrand步骤5,将原始图片序列I和生成的图片序列I一起输入到判别器中,判别器由5个3D卷积层和4个降采样层组成,判别器对应两个输出;当输入生成图片序列I时,判别器输出的特征序列为f,方向序列为d;当输入原始图片序列I时,判别器输出的特征序列为f;realgengengengenrealreal步骤6,3D-GAN模型的训练机制是判别器要尽可能准确的识别出生成的图片序列是假的,而生成器要尽可能使生成的图片序列能够瞒过判别器,两者对抗直到达成平衡。