← 返回列表

一种音频识别方法、音频识别装置、车辆和计算机设备

申请号: CN202311862103.4
申请人: 广州小鹏汽车科技有限公司
更新日期: 2026-03-09

专利详细信息

项目 内容
专利名称 一种音频识别方法、音频识别装置、车辆和计算机设备
专利类型 发明申请
申请号 CN202311862103.4
申请日 2023/12/29
公告号 CN117496972A
公开日 2024/2/2
IPC主分类号 G10L15/22
权利人 广州小鹏汽车科技有限公司
发明人 张辽; 余骁捷
地址 广东省广州市天河区岑村松岗大街8号

摘要文本

广州小鹏汽车科技有限公司获取“一种透气窗帘布”专利技术,本申请公开一种音频识别方法、音频识别装置、车辆和计算机设备。方法包括对待识别音频进行编码,以生成音素概率矩阵;根据预设的句式纠错模型,对音素概率矩阵进行处理,以生成第一发音概率矩阵,发音概率矩阵包括文本特征和槽位特征;在槽位特征的权重不是发音概率矩阵的最大权重的情况下,对第一发音概率矩阵进行解码,以生成第一识别结果;在槽位特征的权重为发音概率矩阵的最大权重的情况下,根据预设的槽位纠错模型对音素概率矩阵进行处理,以生成第二发音概率矩阵;对第二发音概率矩阵解码,以生成第二识别结果,提高车载的语音识别系统的响应速度、效率和维护效率,降低训练时长和存储的空间占用量。

专利主权项内容

1.一种音频识别方法,其特征在于,包括:对待识别音频进行编码,以生成音素概率矩阵;根据预设的句式纠错模型,对所述音素概率矩阵进行处理,以生成第一发音概率矩阵,所述第一发音概率矩阵包括文本特征和槽位特征;在所述槽位特征的权重不是所述第一发音概率矩阵的最大权重的情况下,对所述第一发音概率矩阵进行解码,以生成第一识别结果;在所述槽位特征的权重为所述发音概率矩阵的最大权重的情况下,根据预设的槽位纠错模型对所述音素概率矩阵进行处理,以生成第二发音概率矩阵;对所述第二发音概率矩阵解码,以生成第二识别结果。