← 返回列表

语音识别方法、装置、设备及可读存储介质

申请号: CN202410034818.9
申请人: 科大讯飞股份有限公司
申请日期: 2024/1/10

摘要文本

本申请公开了一种语音识别方法、装置、设备及可读存储介质。本方案中,预先对端到端语音识别模型进行领域自适应训练得到多领域语音识别模型以及各领域的提示向量参数,每个领域的提示向量参数用于指示该领域专有的语音识别信息,在获取待识别语音数据、确定待识别语音数据的声学特征序列之后,获取待识别语音数据所属领域的提示向量参数,将该提示向量参数和声学特征序列,输入该领域的多领域语音识别模型,多领域语音识别模型对提示向量参数和声学特征序列进行编解码处理,得到语音数据的识别结果。本方案可有效保证端到端语音识别模型在各领域识别效果。 数据由马 克 团 队整理

专利详细信息

项目 内容
专利名称 语音识别方法、装置、设备及可读存储介质
专利类型 发明申请
申请号 CN202410034818.9
申请日 2024/1/10
公告号 CN117558263A
公开日 2024/2/13
IPC主分类号 G10L15/06
权利人 科大讯飞股份有限公司
发明人 马志强; 李永超; 孙磊
地址 安徽省合肥市高新开发区望江西路666号

专利主权项内容

1.一种语音识别方法,其特征在于,所述方法包括:获取待识别语音数据;确定所述待识别语音数据的声学特征序列;获取所述待识别语音数据所属领域的提示向量参数,所述提示向量参数是用于指示所述领域专有的语音识别信息;将所述提示向量参数和所述声学特征序列,输入多领域语音识别模型,所述多领域语音识别模型对所述提示向量参数和所述声学特征序列进行编解码处理,得到所述语音数据的识别结果,所述多领域语音识别模型和所述提示向量参数是通过对端到端语音识别模型进行领域自适应训练得到的。 来源:马 克 数 据 网