← 返回列表

语音识别方法、装置及车辆

申请号: CN202410008682.4
申请人: 广州小鹏汽车科技有限公司
更新日期: 2026-03-17

专利详细信息

项目 内容
专利名称 语音识别方法、装置及车辆
专利类型 发明申请
申请号 CN202410008682.4
申请日 2024/1/4
公告号 CN117524199A
公开日 2024/2/6
IPC主分类号 G10L15/02
权利人 广州小鹏汽车科技有限公司
发明人 张辽
地址 广东省广州市天河区岑村松岗大街8号

摘要文本

本申请涉及一种语音识别方法、装置及车辆。该方法包括:接收车辆座舱内用户发出的语音请求;当检测到语音请求中静音的持续时长大于第一时长且小于第二时长时,将第一音素概率矩阵输入语音识别系统的语音解码图中进行解码,获得对应的第一语音识别文本;若第一语音识别文本的语义不完整,则保留第一语音识别文本;将第二音素概率矩阵输入语音解码图中进行解码,获得对应的第二语音识别文本;将第一语音识别文本与第二语音识别文本共同输出并在车载系统的图形用户界面显示。本申请提供的方案,能够确保语音识别结果的准确性,以及缩短句中静音时长,提高语音识别效率,改善用户体验。

专利主权项内容

1.一种语音识别方法,其特征在于,包括:接收车辆座舱内用户发出的语音请求;当检测到所述语音请求中静音的持续时长大于第一时长且小于第二时长时,将所述静音之前的第一有效语音进行特征提取,生成对应的第一声学特征向量;将所述静音之后的第二有效语音进行特征提取,生成对应的第二声学特征向量;依时序分别将所述第一声学特征向量输入声学模型,获得对应的第一音素概率矩阵;及将所述第二声学特征向量输入所述声学模型,获得对应的第二音素概率矩阵;将所述第一音素概率矩阵输入语音识别系统的语音解码图中进行解码,获得对应的第一语音识别文本;若所述第一语音识别文本的语义不完整,则保留所述第一语音识别文本;将所述第二音素概率矩阵输入所述语音解码图中进行解码,获得对应的第二语音识别文本;将所述第一语音识别文本与第二语音识别文本共同输出并在车载系统的图形用户界面显示。。百度搜索马 克 数 据 网