← 返回列表

基于声学双谱的鸟鸣声源定位方法及系统

申请号: CN202410179288.7
申请人: 百鸟数据科技(北京)有限责任公司
申请日期: 2024/2/18

摘要文本

本申请涉及语音处理技术领域,提出了基于声学双谱的鸟鸣声源定位方法及系统,包括:采集每个监控区域中的声音信号以及声音监测设备的空间位置向量;基于每个阵元麦克风采集声音信号的梅尔语谱图中每帧上不同频率带之间能量分布集中特征的分析结果确定梅尔频带能量聚集凸显度;基于每个频率带的梅尔频带能量聚集凸显度以及能量稳定变化持续时间的长短确定鸟类信息帧显著系数;采用VAD算法基于鸟类信息帧显著系数得到每个阵元麦克风采集声音信号的若干个声音信号片段;采用基于广义互相关时延估计的声源估计算法基于所有声音信号片段确定声音信号的定位结果。本申请自适应地对双门限端点检测算法中的阈值进行设定,提高声源定位结果的准确率。

专利详细信息

项目 内容
专利名称 基于声学双谱的鸟鸣声源定位方法及系统
专利类型 发明申请
申请号 CN202410179288.7
申请日 2024/2/18
公告号 CN117724042A
公开日 2024/3/19
IPC主分类号 G01S5/18
权利人 百鸟数据科技(北京)有限责任公司
发明人 舒璐; 覃业锋
地址 北京市海淀区学清路8号科技财富中心B座11层B1101-B

专利主权项内容

1.基于声学双谱的鸟鸣声源定位方法,其特征在于,该方法包括以下步骤:将自然保护地划分为若干个监控区域,采集每个监控区域中的声音信号以及声音监测设备的空间位置向量;基于每个阵元麦克风采集声音信号的梅尔语谱图中每帧上不同频率带之间能量分布集中特征的分析结果确定每帧上每个频率带的梅尔频带能量聚集凸显度;基于每个阵元麦克风采集声音信号的梅尔语谱图中每帧上每个频率带的梅尔频带能量聚集凸显度以及能量稳定变化持续时间的长短确定每个阵元麦克风采集声音信号中每帧信号的鸟类信息帧显著系数;采用VAD算法基于每个阵元麦克风采集声音信号中所有帧信号的鸟类信息帧显著系数得到每个阵元麦克风采集声音信号的若干个声音信号片段;采用基于广义互相关时延估计的声源估计算法基于每个麦克风阵列中所有阵元麦克风采集声音信号的所有声音信号片段确定声音信号的定位结果。 微信公众号马克 数据网