← 返回列表

改进的语音可懂度

申请号: CN202111256933.3
申请人: 汇顶科技(香港)有限公司
申请日期: 2016年6月13日

摘要文本

本文公开了一种包括处理器和存储器的装置。存储器包括从采样环境噪声计算噪声频谱估值的噪声频谱估计器,从输入语音计算语音频谱估值的语音频谱估计器,使用在语音频谱中检测的每个共振峰内的噪声频谱估值和语音频谱估值计算SNR估值的共振峰信噪比(SNR)估计器。存储器还包括共振峰升高估计器,其计算一组增益因数并将该组增益因数应用到输入语音的每个频率分量,使得在每个共振峰内的所得SNR达到预选目标值。 该数据由<马克数据网>整理

专利详细信息

项目 内容
专利名称 改进的语音可懂度
专利类型 发明授权
申请号 CN202111256933.3
申请日 2016年6月13日
公告号 CN113823319B
公开日 2024年1月19日
IPC主分类号 G10L21/0364
权利人 汇顶科技(香港)有限公司
发明人 阿德里安·丹尼尔
地址 中国香港上水龙琛路39号上水广场21楼2113室

专利主权项内容

1.一种用于执行改进语音可懂度的操作的方法,其特征在于,包括:接收输入语音信号;从采样环境噪声计算噪声频谱估值;从所述输入语音信号计算语音频谱估值;计算在所述计算的噪声频谱估值和所述语音频谱估值中的共振峰SNR估值;分割在所述语音频谱估值中的共振峰;以及基于计算的所述共振峰SNR估值计算用于所述共振峰中的每个共振峰的一组增益因数;将所述一组增益因数应用到所述输入语音信号的每个频率分量,以使所述每个共振峰内的所得SNR估值达到预选的目标值;所述计算所述语音频谱估值包括使用低阶线性预测滤波器计算所述语音频谱估值;其中,所述分割在所述语音频谱估值中的共振峰包括:根据定位标志形成分段线性信号,在局部最小值等于0dB的情况下从均衡语音频谱包络减去所述分段线性信号,以获得归一化的频谱包络。