语音识别方法、装置、设备及可读存储介质

申请号: CN202410034818.9

申请人: 科大讯飞股份有限公司

申请日期: 2024/1/10

摘要文本

本申请公开了一种语音识别方法、装置、设备及可读存储介质。本方案中，预先对端到端语音识别模型进行领域自适应训练得到多领域语音识别模型以及各领域的提示向量参数，每个领域的提示向量参数用于指示该领域专有的语音识别信息，在获取待识别语音数据、确定待识别语音数据的声学特征序列之后，获取待识别语音数据所属领域的提示向量参数，将该提示向量参数和声学特征序列，输入该领域的多领域语音识别模型，多领域语音识别模型对提示向量参数和声学特征序列进行编解码处理，得到语音数据的识别结果。本方案可有效保证端到端语音识别模型在各领域识别效果。数据由马克团队整理

申请人信息

申请人:科大讯飞股份有限公司
申请人地址:230088 安徽省合肥市高新区望江西路666号
发明人: 科大讯飞股份有限公司

专利详细信息

项目	内容
专利名称	语音识别方法、装置、设备及可读存储介质
专利类型	发明申请
申请号	CN202410034818.9
申请日	2024/1/10
公告号	CN117558263A
公开日	2024/2/13
IPC主分类号	G10L15/06
权利人	科大讯飞股份有限公司
发明人	马志强; 李永超; 孙磊
地址	安徽省合肥市高新开发区望江西路666号

专利主权项内容

1.一种语音识别方法，其特征在于，所述方法包括：获取待识别语音数据；确定所述待识别语音数据的声学特征序列；获取所述待识别语音数据所属领域的提示向量参数，所述提示向量参数是用于指示所述领域专有的语音识别信息；将所述提示向量参数和所述声学特征序列，输入多领域语音识别模型，所述多领域语音识别模型对所述提示向量参数和所述声学特征序列进行编解码处理，得到所述语音数据的识别结果，所述多领域语音识别模型和所述提示向量参数是通过对端到端语音识别模型进行领域自适应训练得到的。来源：马克数据网

语音识别方法、装置、设备及可读存储介质

摘要文本

申请人信息

专利详细信息

专利主权项内容

热门技术领域

快速入口

专利技术资料

语音识别方法、装置、设备及可读存储介质

摘要文本

申请人信息

专利详细信息

专利主权项内容

相关专利推荐

一种粉煤灰砖块运输装置

一种桥梁支座调节机构

天然气管道安装辅助装置

一种自卸式半挂车

一种双红一紫火灾爆炸二合一火焰探测器

含气量自动解吸装置

热门技术领域

快速入口

专利技术资料