← 返回列表

基于深度学习的手提电脑语音识别方法及系统

申请号: CN202410178427.4
申请人: 广州紫麦科技有限公司
更新日期: 2026-03-17

专利详细信息

项目 内容
专利名称 基于深度学习的手提电脑语音识别方法及系统
专利类型 发明申请
申请号 CN202410178427.4
申请日 2024/2/9
公告号 CN117727298A
公开日 2024/3/19
IPC主分类号 G10L15/06
权利人 广州紫麦科技有限公司
发明人 王大可; 徐进; 潘营
地址 广东省广州市黄埔区科丰路29号C3栋202房

摘要文本

本申请实施例提供一种基于深度学习的手提电脑语音识别方法及系统,通过对待识别语音数据包含的各语音区块进行声学属性向量解析,可以有效地从复杂的待识别语音数据中获取关键信息,提高了语音识别的准确性和效率。其次,使用时空优化模型进行属性向量优化,能够充分利用语音信号中的时空信息,进一步增强语音识别的精确性。此外,通过确定各语音区块关联的干扰特征参数,能够有效地处理并削减语音信号中的干扰,使得在噪声环境下的语音识别更加准确。最后,根据目标语义意图数据对手提电脑进行功能控制,实现了智能交互,极大地提升了用户体验。 来自马-克-数-据-官网

专利主权项内容

1.一种基于深度学习的手提电脑语音识别方法,其特征在于,应用于语音识别系统,所述方法包括:获取输入到所述手提电脑中的包含目标声源的待识别语音数据,并对所述待识别语音数据包含的各语音区块进行声学属性向量解析,生成对应的区块声学属性向量;基于在先完成模型参数学习的时空优化模型,依据所述各语音区块分别在所述待识别语音数据中的时空信息,分别对对应的区块声学属性向量进行时空优化,生成对应的包含时空信息的优化属性向量;依据各优化属性向量各自与预先定义的模板属性向量之间的特征距离,分别确定所述各语音区块分别关联的干扰特征参数;其中,各模板属性向量是依据干扰屏蔽音频数据进行解析的,且每个模板属性向量包含相应语音区块的时空信息,所述干扰屏蔽音频数据包含不存在干扰特征的目标声源;依据生成的各干扰特征参数,确定所述待识别语音数据的干扰状态数据,并基于所述待识别语音数据的干扰状态数据对所述待识别语音数据进行优化处理以生成对应的目标语音数据,对所述目标语音数据进行语义意图识别,获得对应的目标语义意图数据后,基于所述目标语义意图数据对所述手提电脑进行功能控制。