← 返回列表
一种环境噪声识别方法、系统、设备和介质
申请人信息
- 申请人:广州声博士声学技术有限公司
- 申请人地址:511400 广东省广州市番禺区石楼镇华山路12号
- 发明人: 广州声博士声学技术有限公司
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种环境噪声识别方法、系统、设备和介质 |
| 专利类型 | 发明申请 |
| 申请号 | CN202311818042.1 |
| 申请日 | 2023/12/27 |
| 公告号 | CN117476036A |
| 公开日 | 2024/1/30 |
| IPC主分类号 | G10L25/30 |
| 权利人 | 广州声博士声学技术有限公司 |
| 发明人 | 郑建辉; 叶永华; 殷艺敏 |
| 地址 | 广东省广州市番禺区石楼镇华山路12号 |
摘要文本
广州声博士声学技术有限公司获取“一种透气窗帘布”专利技术,本发明涉及声音识别技术领域,公开了一种环境噪声识别方法、系统、设备和介质。本发明将原始音频数据划分为有标签的源域原始音频数据和无标签的目标域原始音频数据;构建包括对比学习网络、对抗训练学习网络和分类识别网络的音频识别网络模型;将每个音频数据转换为对应的声谱图组并进行特征提取,得到特征向量组;根据特征向量组在源域和目标域对对比学习网络和对抗训练学习网络进行训练,并根据源域特征向量组对所述分类识别网络进行标签的分类识别训练,得到训练好的音频识别网络模型;通过训练好的音频识别网络模型对环境噪声进行识别分类。本发明降低了数据标记的成本, 提高了环境噪声分类的准确性,提高了模型的泛化能力。
专利主权项内容
1.一种环境噪声识别方法,其特征在于,所述方法包括:将原始音频数据依据是否有标签划分为有标签的源域原始音频数据和无标签的目标域原始音频数据;构建音频识别网络模型,所述音频识别网络模型包括对比学习网络、对抗训练学习网络和分类识别网络;分别将每一个源域原始音频数据和目标域原始音频数据转换为对应的源域声谱图组和目标域声谱图组;对所述源域声谱图组和目标域声谱图组进行特征提取,分别得到源域特征向量组和目标域特征向量组;根据所述源域特征向量组和目标域特征向量组,在源域和目标域对所述对比学习网络和对抗训练学习网络进行训练,并根据所述源域特征向量组对所述分类识别网络进行标签的分类识别训练,得到训练好的音频识别网络模型;通过训练好的音频识别网络模型对环境噪声进行识别分类。