← 返回列表

一种基于机器学习的语音识别方法及NLP平台

申请号: CN202311337518.X
申请人: 武汉赛思云科技有限公司
申请日期: 2023/10/13

摘要文本

本公开提供一种基于机器学习的语音识别方法及NLP平台,通过事先调试好的目标语音识别算法识别语音信号中的关键信息,基于机器学习调试得到的高性能算法,精度高,能提高获取语音关键信息的准确性,在算法的调试过程中,为相同关键信息语义标记下的样例语义描述集合预设置多个基础子关键信息质心,并确定样例语义描述集合中多个样例语义描述分别对应的基础子关键信息质心,为相同关键信息语义标记下的多个样例语义描述预设置多个子信息,再基于多个样例语义描述与分别对应的基础子关键信息质心之间的相似性评分,对多个基础子关键信息质心进行调节,调试的样本量要求低,在保障算法的识别精度的前提下,增加调试效率,节约计算消耗,降低了成本。

专利详细信息

项目 内容
专利名称 一种基于机器学习的语音识别方法及NLP平台
专利类型 发明申请
申请号 CN202311337518.X
申请日 2023/10/13
公告号 CN117334186A
公开日 2024/1/2
IPC主分类号 G10L15/065
权利人 武汉赛思云科技有限公司
发明人 高辉杰; 庄志远; 孙岚
地址 湖北省武汉市东湖新技术开发区武大园四路3号国家地球空间信息产业基地II区(6期)A-3栋13层10号

专利主权项内容

1.一种基于机器学习的语音识别方法,其特征在于,应用于NLP平台,所述方法包括:获取待识别语音信号,将所述待识别语音信号输入目标语音识别算法,所述目标语音识别算法为基于语音样本事先调试得到;通过所述目标语音识别算法对所述待识别语音信号进行识别,得到所述待识别语音信号中的关键信息识别结果;所述目标语音识别算法在调试时,包括以下步骤:基于待调试语音识别算法对语音学习样例集中注释相同关键信息语义标记的多个语音学习样例进行语义描述挖掘,得到相同关键信息语义标记下的样例语义描述集合,所述语音学习样例集中包括注释有多个关键信息语义标记的语音学习样例;为所述样例语义描述集合预设置多个基础子关键信息质心,并确定所述样例语义描述集合中多个样例语义描述分别对应的基础子关键信息质心;基于所述多个样例语义描述与分别对应的基础子关键信息质心之间的相似性评分,对所述多个基础子关键信息质心进行调节,得到相同关键信息语义标记下的一个或多个目标子关键信息质心;基于多个关键信息语义标记下的目标子关键信息质心以及属于各个目标子关键信息质心的样例语义描述,确定算法代价,并基于所述算法代价调试所述待调试语音识别算法。