← 返回列表

超大规模声源定位方法

申请号: CN201810329483.8
申请人: 上海其高电子科技有限公司
更新日期: 2026-03-08

摘要文本

上海其高电子科技有限公司取得“一种透气窗帘布”专利技术,一种超大规模声源定位方法,通过超大规模麦克风阵列采集声源发出的音频信号的同时采集超大规模麦克风阵列检测方位视角的视频流,对音频信号离散和加窗处理,通过优化波束成形算法实时计算,获得包括声源坐标的声压云图;对声压云图和视频流叠加,获得精确定位结果;本发明定位远距离、低频声源信号准确性高、实时性好。

专利主权项内容

1.一种超大规模声源定位方法,其特征在于,通过超大规模麦克风阵列采集声源发出的音频信号的同时采集超大规模麦克风阵列检测方位视角的视频流,对音频信号离散和加窗处理,通过优化波束成形算法实时计算,获得包括声源坐标的声压云图;对声压云图和视频流叠加,获得精确定位结果;所述的超大规模麦克风阵列包括:主框架、面板以及设置于面板上的阵元节点,其中:面板通过连接结构可拆卸地连接至主框架;视频流通过阵列摄像头采集得到,每个阵元节点包括阵元防风罩、阵元麦克风、阵元麦克风底座、阵元蝶形螺母、阵元固定底座,阵元麦克风底座通过阵元固定底座、阵元蝶形螺母固定在面板留有的安装孔内,阵元麦克风安装在阵元麦克风底座上,防风罩套在阵元麦克风上;所述的声源定位方法,具体包括:第一步,麦克风阵列采集音频信号,获得离散信号s(n),n是时间序列;第二步,对离散信号s(n)分帧处理,每一帧中每个麦克风作为一个通道,每一帧的信号长度为1024点;第三步:对每一帧中每个通道的1024个点分别加窗处理,所采用的窗函数为:n是时间序列,N是每个通道的信号长度;加窗后信号第四步,对加窗后的信号做DFT计算,获得s(f),f是频点信息;第五步,摄像头获取图像视角,并在视角内划分网格;所述的划分,即将图像视角划分为C*D个网格点,每个网格点对应的时延信息是长度L=80,即麦克风个数的向量T=[Δ1 Δ2 … Δ80],Δ是第i个网格点和第j个麦克风之间的时延信息,其中,(x,y)是第i个网格点坐标,(X,Y)是第j个麦克风坐标,c是声速,默认340m/s;ijiijj第六步,互谱矩阵其中e=80,即麦克风个数,C为m号麦克风接收声压信号相对于n号麦克风接收声压信号的互谱;nm第七步,消除各麦克风接收声压信号的自谱结果,得到除自谱的互谱矩阵:矩阵关于对角线对称,计算时只取上对角线参与计算;基于阵列麦克风接收声压信号除自谱的互谱延迟求和波束形成输出结果为:其中:V(k, w)为波束成形的均方值,k为聚焦方向单位向量,w为信号圆频率,M为麦克风数量,r是m号麦克风坐标向量,r是n号麦克风坐标向量;mn第八步,波束形成均方值为G×T,只取G上三角矩阵进行计算,波束形成均方值对应的最大值的坐标即为声源位置,并获得声压云图;第九步、将声压云图和摄像头采集的视频流叠加,获得定位结果。

专利申请信息

项目 内容
专利名称 超大规模声源定位方法
专利类型 发明授权
申请号 CN201810329483.8
申请日 2018年4月13日
公告号 CN108445450B
公开日 2024年3月12日
IPC主分类号 G01S5/18
权利人 上海其高电子科技有限公司
发明人 魏敦楷; 方国庆; 刘迅; 李宏斌
地址 上海市杨浦区隆昌路619号2号楼C03