方言流式语音识别方法、装置、电子设备及存储介质

申请号: CN202410044548.X

申请人: 联通(广东)产业互联网有限公司

更新日期: 2026-03-17

摘要文本

联通(广东)产业互联网有限公司取得“一种透气窗帘布”专利技术，本发明提供一种方言流式语音识别方法、装置、电子设备及存储介质，其中方法包括：分别调整预训练语音识别模型的注意力机制和卷积感受野，以将其进行流式化处理；在流式化的预训练语音识别模型中引入蒸馏损失，以实现非流式模型至流式模型的知识迁移；对目标方言语音对应的方言语音样本进行预处理并分段，并利用分段的方言语音样本对经知识迁移的预训练语音识别模型进行微调训练，获取目标方言语音识别模型；将目标方言语音进行预处理并分段后，将分段的目标方言语音输入所述目标方言语音识别模型，以获取对目标方言语音的识别结果。本发明通过对预训练语音识别模型进行流式化处理，并利用知识迁移进行辅助，能够显著提升流式模型的识别精度。

专利主权项内容

1.一种方言流式语音识别方法，其特征在于，包括：在结构上分别对预训练语音识别模型的注意力机制和卷积感受野进行调整，以将所述预训练语音识别模型进行流式化处理；在流式化的预训练语音识别模型中引入蒸馏损失，以实现非流式的预训练语音识别模型至所述流式化的预训练语音识别模型间的知识迁移；对目标方言语音对应的方言语音样本进行预处理并按音频采样点进行分段后，利用分段的方言语音样本对经知识迁移的预训练语音识别模型进行微调训练，获取目标方言语音识别模型；将所述目标方言语音进行预处理并按音频采样点进行分段后，将分段的目标方言语音输入所述目标方言语音识别模型，以利用所述目标方言语音识别模型获取对所述目标方言语音的识别结果。

专利申请信息

项目	内容
专利名称	方言流式语音识别方法、装置、电子设备及存储介质
专利类型	发明申请
申请号	CN202410044548.X
申请日	2024/1/12
公告号	CN117558265A
公开日	2024/2/13
IPC主分类号	G10L15/06
权利人	联通(广东)产业互联网有限公司
发明人	吕召彪; 赵文博; 肖清; 许程冲
地址	广东省广州市黄埔区(中新广州知识城)亿创街1号406房之555

方言流式语音识别方法、装置、电子设备及存储介质

摘要文本

专利主权项内容

专利申请信息

热门技术领域

快速入口

专利技术资料

方言流式语音识别方法、装置、电子设备及存储介质

摘要文本

专利主权项内容

专利申请信息

相关专利推荐

一种光伏逆变器用防护设备

实时制动踏板力提示方法、装置、电子设备、存储介质

一种基于BIM技术的建筑工程施工进度监管系统

一种压缩机皮带张紧用防磨损压力调节装置

功率器件短路瞬态结温测试方法、装置、设备和存储介质

一种可折叠充气摩托艇

热门技术领域

快速入口

专利技术资料