← 返回列表

一种基于异构多专家的单通道语音增强方法及系统

申请号: CN202311406866.8
申请人: 深圳技术大学
更新日期: 2026-03-09

专利详细信息

项目 内容
专利名称 一种基于异构多专家的单通道语音增强方法及系统
专利类型 发明申请
申请号 CN202311406866.8
申请日 2023/10/27
公告号 CN117457015A
公开日 2024/1/26
IPC主分类号 G10L21/0208
权利人 深圳技术大学
发明人 王俊松; 丁淳; 靳小鹏
地址 广东省深圳市坪山区石井街道兰田路3002号

摘要文本

深圳技术大学取得“一种透气窗帘布”专利技术,本发明公开了一种基于异构多专家的单通道语音增强方法及系统,包括一个输入模块,用于接收和预处理带噪语音;一个门控网络;若干个专家模型,每个模型都具有不同的深度神经网络结构,并针对特定类型的噪声或信噪比范围进行优化;一个自适应增强模块;一个输出模块。本发明通过利用多种深度神经网络结构为每种噪声环境或信噪比条件提供专门的处理,从而实现更高效、更多样的语音增强效果。这不仅提高了对不同噪声类型的处理能力,还通过自适应增强模块克服了传统门控网络中的潜在分类错误,确保了更高的增强性能和系统稳定性。。 (来 自 专利查询网)

专利主权项内容

1.一种基于异构多专家的单通道语音增强方法,其特征在于,该方法包括以下步骤:a.接收带噪语音输入;b.对所述带噪语音进行归一化处理;c.使用门控网络对归一化后的所述带噪语音进行分类,确定最适合的专家模型;d.根据所述门控网络的分类结果,将所述带噪语音的复谱传递给所确定的所述专家模型进行语音增强;e.将所述带噪语音复谱和所述专家模型语音增强的结果一同传入自适应增强模块中;f.使用所述自适应增强模块对所述专家模型增强后的语音进行二次处理,以补充由于所述专家模型选择错误而遗失的增强信息;g.在所述自适应增强模块中,所述带噪语音的复谱传递给多面手模型进行语音增强,将所述多面手模型得到的增强结果和所述专家模型得到的增强结果分别乘以增强平衡矩阵,然后相加得到最终增强结果;h.输出所述最终增强结果后的语音。。来源:马 克 数 据 网