语音识别模型生成方法、语音识别方法、设备和介质

申请号: CN202410119020.4

申请人: 北京安声科技有限公司

申请日期: 2024/1/29

摘要文本

本公开的实施例公开了语音识别模型生成方法、语音识别方法、设备和介质。该方法的一具体实施方式包括：通过初始音频编码子模型对样本音频信息进行编码处理，得到音频编码信息；通过初始关键文本子模型对各个关键文本信息进行特征提取处理，得到至少一个关键文本特征信息；通过初始融合解码子模型对音频编码信息和至少一个关键文本特征信息进行融合解码处理，得到文本信息；根据样本文本信息和文本信息，确定初始模型是否训练完成；响应于确定初始模型训练完成，将初始模型确定为语音识别模型。通过本公开的一些实施例的语音识别模型生成方法得到的语音识别模型可以提高特定词汇的识别准确率，进而提高语音识别的准确率和召回率，提高识别效果。

申请人信息

申请人:北京安声科技有限公司
申请人地址:100088 北京市海淀区北三环中路44号4号楼1层120
发明人: 北京安声科技有限公司

专利详细信息

项目	内容
专利名称	语音识别模型生成方法、语音识别方法、设备和介质
专利类型	发明申请
申请号	CN202410119020.4
申请日	2024/1/29
公告号	CN117649846A
公开日	2024/3/5
IPC主分类号	G10L15/06
权利人	北京安声科技有限公司
发明人	徐银海; 刘益帆; 丁丹; 赵明洲
地址	北京市海淀区北三环中路44号4号楼1层120

专利主权项内容

1.一种语音识别模型生成方法，包括：通过初始模型包括的初始音频编码子模型对样本音频信息进行编码处理，得到音频编码信息；通过初始模型包括的初始关键文本子模型对至少一个关键文本信息中的各个关键文本信息进行特征提取处理，得到至少一个关键文本特征信息，其中，关键文本信息是根据样本音频信息对应的样本文本信息生成的；通过初始模型包括的初始融合解码子模型对音频编码信息和至少一个关键文本特征信息进行融合解码处理，得到文本信息；根据对应样本音频信息的样本文本信息和得到的文本信息，确定初始模型是否训练完成；响应于确定初始模型训练完成，将初始模型确定为语音识别模型。来源：百度马克数据网

语音识别模型生成方法、语音识别方法、设备和介质

摘要文本

申请人信息

专利详细信息

专利主权项内容

热门技术领域

快速入口

专利技术资料

语音识别模型生成方法、语音识别方法、设备和介质

摘要文本

申请人信息

专利详细信息

专利主权项内容

相关专利推荐

一种全光产品的质量检测方法及系统

一种3D打印机脱料装置

一种基于试验数据库的压气机性能仿真程序精度评估方法

一种基于灰盒模型的节流阀响应预测方法

一种用于水性工业漆的加工装置

双辐板涡轮盘

热门技术领域

快速入口

专利技术资料