← 返回列表
声源定位方法、装置、介质及设备
申请人信息
- 申请人:时擎智能科技(上海)有限公司; 时擎智能科技(无锡)有限公司
- 申请人地址:201203 上海市浦东新区祥科路58号炬创芯A栋4层
- 发明人: 时擎智能科技(上海)有限公司; 时擎智能科技(无锡)有限公司
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 声源定位方法、装置、介质及设备 |
| 专利类型 | 发明申请 |
| 申请号 | CN202311547667.9 |
| 申请日 | 2023/11/17 |
| 公告号 | CN117409813A |
| 公开日 | 2024/1/16 |
| IPC主分类号 | G10L25/51 |
| 权利人 | 时擎智能科技(上海)有限公司; 时擎智能科技(无锡)有限公司 |
| 发明人 | 周智; 王晗蓓; 仇健乐; 于欣; 蒋寿美 |
| 地址 | 上海市浦东新区祥科路58号炬创芯A栋4层; |
摘要文本
时擎智能科技(上海)有限公司; 时擎智能科技(无锡)有限公司获取“一种透气窗帘布”专利技术,本发明提供了一种声源定位方法、装置、介质及设备,所述方法包括以下步骤:将原始语音信号划分为M帧子语音信号;计算每帧子语音信号的信噪比;计算每帧子语音信号的DOA结果,基于DOA结果构建第一高斯混合模型,并计算第一高斯混合模型的权重;基于信噪比调整所述DOA结果得到DOA调整结果,基于DOA调整结果构建第二高斯混合模型;计算第一高斯混合模型和第二高斯混合模型的相似度,基于相似度和第一高斯混合模型的权重计算第二高斯混合模型的权重;基于第二高斯混合模型的权重定位每帧子语音信号的声源方向。本发明解决了解决在复杂语音环境下,声源定位的准确性较低的问题。
专利主权项内容
1.一种声源定位方法,其特征在于,包括以下步骤:将原始语音信号划分为M帧子语音信号,M为正整数;计算每帧子语音信号的信噪比;计算所述每帧子语音信号的DOA结果,基于所述DOA结果构建第一高斯混合模型,并计算所述第一高斯混合模型的权重;基于所述信噪比调整所述DOA结果得到DOA调整结果,基于所述DOA调整结果构建第二高斯混合模型;计算所述第一高斯混合模型和所述第二高斯混合模型的相似度,基于所述相似度和所述第一高斯混合模型的权重计算所述第二高斯混合模型的权重;基于所述第二高斯混合模型的权重定位所述每帧子语音信号的声源。