一种智慧语音LED/LCD时钟及语音处理方法
申请人信息
- 申请人:深圳市茂捷智能科技有限公司
- 申请人地址:518000 广东省深圳市福田区沙头街道天安社区泰然六路泰然苍松大厦十四层07号
- 发明人: 深圳市茂捷智能科技有限公司
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种智慧语音LED/LCD时钟及语音处理方法 |
| 专利类型 | 发明申请 |
| 申请号 | CN202311376234.1 |
| 申请日 | 2023/10/23 |
| 公告号 | CN117392979A |
| 公开日 | 2024/1/12 |
| IPC主分类号 | G10L15/22 |
| 权利人 | 深圳市茂捷智能科技有限公司 |
| 发明人 | 周华明 |
| 地址 | 广东省深圳市福田区沙头街道天安社区泰然六路泰然苍松大厦十四层07号 |
摘要文本
深圳市茂捷智能科技有限公司取得“一种透气窗帘布”专利技术,本发明公开了一种智慧语音LED/LCD时钟及语音处理方法,时钟包括:LED屏/LCD屏、音频输入模块、音频处理系统、音频输出模块及控制模块;LED屏/LCD屏、音频输入模块、音频处理系统、音频输出模块分别与控制模块电连接;音频处理系统包括训练模块及判决模块;训练模块包括音频分离单元、梯度单元及训练单元;通过利用方差特征、匹配度特征以及噪声帧数阈值对拾取的用户声音进行分离,提高了分离精度;通过进行梯度量化并采用多个子判决器对不同的梯度特征进行判决识别,提高在低信噪比下对语音指令内容的识别精度,提高了智慧语音LED/LCD时钟的用户体验。
专利主权项内容
1.一种智慧语音LED/LCD时钟,其特征在于,包括:LED屏/LCD屏、音频输入模块、音频处理系统、音频输出模块及控制模块;所述LED屏/LCD屏、所述音频输入模块、所述音频处理系统、所述音频输出模块分别与所述控制模块电连接;所述LED屏/LCD屏用于显示时钟信息;所述音频输入模块用于拾取用户语音指令;所述音频处理系统用于对拾取的音频信号进行处理;所述音频输出模块用于根据控制指令输出交互语音;其中,所述音频处理系统包括训练模块及判决模块;所述训练模块包括音频分离单元、梯度单元及训练单元;所述音频分离单元用于:利用两步法进行语音分离:第一步、从拾取的声音信号中提取方差特征及匹配度特征;第二步、若所述声音信号的基准参量小于规定阈值,且方差特征值小于规定阈值或匹配度特征值小于规定阈值,则当前帧为噪声帧,若所述声音信号的基准参量大于规定阈值,且所述方差特征值和所述匹配度特征值分别小于其规定阈值,则当前帧为噪声帧,获取噪声段及语音段;所述梯度单元用于:将所述噪声段分别与各指令语音样本进行叠加,对叠加后获取的训练信号集提取谱分布特征,并对所述谱分布特征进行阶梯量化,获取第一梯度特征、第二梯度特征、第三梯度特征及梯度特征集;所述训练单元用于:利用所述梯度特征集对所述第一梯度特征、第二梯度特征及第三梯度对应的第一子判决器、第二子判决器、第三子判决器进行训练;所述判决单元用于:利用训练完成的所述第一子判决器、第二子判决器、第三子判决器对拾取的声音信号进行投票判决;其中,所述基准参量为该帧的对数能量与谱熵的比值,所述第一梯度特征的能量强度大于第二梯度特征的能量强度,所述第二梯度特征的能量强度大于第三梯度特征的能量强度,所述梯度特征集包括第一梯度特征子集、第二梯度特征子集及第三梯度特征子集。