← 返回列表
音频识别方法、音频识别装置、车辆、计算机设备和介质
申请人信息
- 申请人:广州小鹏汽车科技有限公司
- 申请人地址:510000 广东省广州市天河区岑村松岗大街8号
- 发明人: 广州小鹏汽车科技有限公司
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 音频识别方法、音频识别装置、车辆、计算机设备和介质 |
| 专利类型 | 发明申请 |
| 申请号 | CN202311800969.2 |
| 申请日 | 2023/12/25 |
| 公告号 | CN117456999A |
| 公开日 | 2024/1/26 |
| IPC主分类号 | G10L15/22 |
| 权利人 | 广州小鹏汽车科技有限公司 |
| 发明人 | 张辽; 余骁捷 |
| 地址 | 广东省广州市天河区岑村松岗大街8号 |
摘要文本
广州小鹏汽车科技有限公司获取“一种透气窗帘布”专利技术,本申请公开一种音频识别方法、音频识别装置、车辆、计算机设备和介质。方法包括:对待识别音频进行编码,以生成发音概率矩阵;通过预设的延迟纠错模型,对发音概率矩阵进行纠错,以得到对应的字结果和输出概率矩阵;对字结果和输出概率矩阵进行发音映射,以得到映射概率矩阵,并根据映射概率矩阵和发音概率矩阵,生成目标概率矩阵;对目标概率矩阵输入到语音解码图进行解码,以得到识别结果。通过延迟纠错模型具备的纠错能力,对发音概率矩阵进行纠错,从而获取到准确的字结果,提高音频识别的准确性,且延迟纠错模型可以有效地节省算力,节省存储空间等。
专利主权项内容
1.一种音频识别方法,其特征在于,包括:对待识别音频进行编码,以生成发音概率矩阵;通过预设的延迟纠错模型,对所述发音概率矩阵进行纠错,以得到对应的字结果和输出概率矩阵;对所述字结果和所述输出概率矩阵进行发音映射,以得到映射概率矩阵,并根据所述映射概率矩阵和所述发音概率矩阵,生成目标概率矩阵;将所述目标概率矩阵输入到语音解码图进行解码,以得到识别结果。 来源:百度搜索马克数据网