← 返回列表
一种基于多传感器融合的远场声音分类方法和装置
摘要文本
本申请涉及一种基于多传感器融合的远场声音分类方法和装置。该方法包括:构建具有多个音频传感器的传感器阵列,所述音频传感器具有置信度,所述置信度用于表征所述音频传感器的可靠性;响应于接收的音频信号,由多个音频传感器对音频信号进行预处理,提取音频特征;将所述音频特征输入至预先训练的声音分类模型,获得初步声音分类结果;将多个传感器的初步声音分类结果输入至融合处理模型,获得最终声音分类结果;依据所述最终声音分类结果,调整所述音频传感器的置信度。本申请融合多个传感器的初步分类结果,获得最终分类结果,同时使用最终分类结果反向计算调整传感器置信度,使传感器置信度判断依据更加丰富和客观,增加远场声音分类准确度。
申请人信息
- 申请人:中国电子科技集团公司第十五研究所
- 申请人地址:100083 北京市海淀区北四环中路211号
- 发明人: 中国电子科技集团公司第十五研究所
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种基于多传感器融合的远场声音分类方法和装置 |
| 专利类型 | 发明申请 |
| 申请号 | CN202410159987.5 |
| 申请日 | 2024/2/5 |
| 公告号 | CN117711436A |
| 公开日 | 2024/3/15 |
| IPC主分类号 | G10L25/51 |
| 权利人 | 中国电子科技集团公司第十五研究所 |
| 发明人 | 钟金作; 李国伟; 武阳; 朱威风; 周宇 |
| 地址 | 北京市海淀区北四环中路211号 |
专利主权项内容
1.一种基于多传感器融合的远场声音分类方法,其特征在于,构建具有多个音频传感器的传感器阵列,所述音频传感器具有置信度,所述置信度用于表征所述音频传感器的可靠性;所述方法包括:响应于接收的音频信号,由多个音频传感器对音频信号进行预处理,提取音频特征;将所述音频特征输入至预先训练的声音分类模型,获得初步声音分类结果;将多个传感器的初步声音分类结果输入至融合处理模型,获得最终声音分类结果;其中,所述融合处理模型基于预先训练的深度学习模型构建,能够融合初步声音分类结果、音频传感器置信度、声源距离和音频信号特征进行处理;依据所述最终声音分类结果,调整所述音频传感器的置信度。 来源:百度马 克 数据网