← 返回列表
一种基于动态图卷积的开放驾驶场景下多标签识别方法
申请人信息
- 申请人:南京信息工程大学
- 申请人地址:210032 江苏省南京市江北新区宁六路219号
- 发明人: 南京信息工程大学
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种基于动态图卷积的开放驾驶场景下多标签识别方法 |
| 专利类型 | 发明申请 |
| 申请号 | CN202410140684.9 |
| 申请日 | 2024/2/1 |
| 公告号 | CN117690098A |
| 公开日 | 2024/3/12 |
| IPC主分类号 | G06V20/54 |
| 权利人 | 南京信息工程大学 |
| 发明人 | 陈苏婷; 吴旭 |
| 地址 | 江苏省南京市江北新区宁六路219号 |
摘要文本
本发明公开了一种基于动态图卷积的开放驾驶场景下多标签识别方法,通过构建叠加动态图卷积网络捕捉每幅图像的内容感知类别,叠加动态图卷积网络包括词向量解耦模块、映射对齐模块和叠加动态图卷积模块;步骤如下:S1,词向量解耦模块以类别嵌入后生成的词向量语义为指导,学习特定类别的特征表示,得到特征向量集合D;S2,映射对齐模块通过分析图像中的隐含区域关系来生成特征数据,获取一组感知向量A来表征某种特定类别;S3,将特征向量集合D和感知向量A进行拼接、融合后的特征数据送入叠加动态图卷积模块,再进行特征传播,最后进行多标签分类。本发明能动态捕获每个图像内容感知类别关系,并兼顾模型训练的迭代速度和稳定性。
专利主权项内容
1.一种基于动态图卷积的开放驾驶场景下多标签识别方法,其特征在于,通过构建映射对齐和词向量解耦双端驱动的叠加动态图卷积网络,捕捉每幅图像的内容感知类别关系;以图像数据驱动为主导,真实世界先验知识为约束辅助,实现对开放驾驶场景中多标签图像的识别;所述叠加动态图卷积网络包括词向量解耦模块、映射对齐模块和叠加动态图卷积模块;实现步骤如下:S1,所述词向量解耦模块以类别嵌入后生成的词向量语义为指导,学习特定类别的特征表示,以得到依靠词向量解耦所有类别标签的特征向量集合D;S2,所述映射对齐模块通过分析图像中的隐含区域关系来生成特征数据,获取一组感知向量A来表征某种特定类别;S3,将特征向量集合D和感知向量A进行拼接、融合后得到的特征数据送入叠加动态图卷积模块,所述叠加动态图卷积模块通过全局先验知识图和动态共现叠加图进行特征传播,最后利用DS-GCN模块生成判别向量进行多标签分类。。马 克 数 据 网