← 返回列表

语音识别方法、装置及车辆

申请号: CN202311844966.9
申请人: 广州小鹏汽车科技有限公司
更新日期: 2026-03-09

专利详细信息

项目 内容
专利名称 语音识别方法、装置及车辆
专利类型 发明申请
申请号 CN202311844966.9
申请日 2023/12/29
公告号 CN117524198A
公开日 2024/2/6
IPC主分类号 G10L15/02
权利人 广州小鹏汽车科技有限公司
发明人 张辽
地址 广东省广州市天河区岑村松岗大街8号

摘要文本

广州小鹏汽车科技有限公司获取“一种透气窗帘布”专利技术,本申请涉及一种语音识别方法、装置及车辆。该方法包括:接收车辆座舱内用户发出的语音请求;对待识别的语音请求进行特征提取,生成特征向量;根据输入的特征向量,通过端到端的预设语音识别模型输出对应的语音识别文本,并以子词的形式在车载系统的图形用户界面逐一显示;其中,语音识别模型的建模单元包括子词单元,语音识别文本中的单个单词拆分的子词数量与对应的IPA音节数量相同且强制对齐,以根据IPA音节逐一输出对应的子词。本申请提供的方案,能够将端到端输出的语音识别文本实现与发音的强关联,识别效率高,且用数据量少。 微信公众号马克 数据网

专利主权项内容

1.一种语音识别方法,其特征在于,包括:接收车辆座舱内用户发出的语音请求;对待识别的所述语音请求进行特征提取,生成特征向量;根据输入的所述特征向量,通过端到端的预设语音识别模型输出对应的语音识别文本,并以子词的形式在车载系统的图形用户界面逐一显示;其中,所述语音识别模型的建模单元包括子词单元,所述语音识别文本中的单个单词拆分的子词数量与对应的IPA音节数量相同且强制对齐,以根据所述IPA音节逐一输出对应的子词。 马-克-数据