← 返回列表

一种基于多传感器融合的远场声音分类方法和装置

申请号: CN202410159987.5
申请人: 中国电子科技集团公司第十五研究所
申请日期: 2024/2/5

摘要文本

本申请涉及一种基于多传感器融合的远场声音分类方法和装置。该方法包括:构建具有多个音频传感器的传感器阵列,所述音频传感器具有置信度,所述置信度用于表征所述音频传感器的可靠性;响应于接收的音频信号,由多个音频传感器对音频信号进行预处理,提取音频特征;将所述音频特征输入至预先训练的声音分类模型,获得初步声音分类结果;将多个传感器的初步声音分类结果输入至融合处理模型,获得最终声音分类结果;依据所述最终声音分类结果,调整所述音频传感器的置信度。本申请融合多个传感器的初步分类结果,获得最终分类结果,同时使用最终分类结果反向计算调整传感器置信度,使传感器置信度判断依据更加丰富和客观,增加远场声音分类准确度。

专利详细信息

项目 内容
专利名称 一种基于多传感器融合的远场声音分类方法和装置
专利类型 发明申请
申请号 CN202410159987.5
申请日 2024/2/5
公告号 CN117711436A
公开日 2024/3/15
IPC主分类号 G10L25/51
权利人 中国电子科技集团公司第十五研究所
发明人 钟金作; 李国伟; 武阳; 朱威风; 周宇
地址 北京市海淀区北四环中路211号

专利主权项内容

1.一种基于多传感器融合的远场声音分类方法,其特征在于,构建具有多个音频传感器的传感器阵列,所述音频传感器具有置信度,所述置信度用于表征所述音频传感器的可靠性;所述方法包括:响应于接收的音频信号,由多个音频传感器对音频信号进行预处理,提取音频特征;将所述音频特征输入至预先训练的声音分类模型,获得初步声音分类结果;将多个传感器的初步声音分类结果输入至融合处理模型,获得最终声音分类结果;其中,所述融合处理模型基于预先训练的深度学习模型构建,能够融合初步声音分类结果、音频传感器置信度、声源距离和音频信号特征进行处理;依据所述最终声音分类结果,调整所述音频传感器的置信度。 来源:百度马 克 数据网