← 返回列表

基于机器学习的智能语音交互误唤醒系统及方法

申请号: CN202311663112.0
申请人: 山东凌晓通信科技有限公司
更新日期: 2026-03-09

专利详细信息

项目 内容
专利名称 基于机器学习的智能语音交互误唤醒系统及方法
专利类型 发明申请
申请号 CN202311663112.0
申请日 2023/12/6
公告号 CN117672228A
公开日 2024/3/8
IPC主分类号 G10L15/32
权利人 山东凌晓通信科技有限公司
发明人 平继秒
地址 山东省烟台市中国(山东)自由贸易试验区烟台片区开发区长江路300号业达智谷B楼2201室

摘要文本

本发明公开了基于机器学习的智能语音交互误唤醒系统及方法,涉及智能语音交互技术领域,该系统包括特征采集模块、验证比对模块以及执行输出模块,验证比对模块用于对唤醒词准确度评估值Pgz及口型动态数据做综合评估;其技术要点为:在唤醒词准确度评估值Pgz可用的前提下,对口型动态数据与数据库一致语音数据进行执行,利用语音和视频图像结合判断,避免误唤醒的情况发生,若是遇到无法检测到用户口型的场景下,则可通过智能设备之间的联动,利用至少两组语音采集单元获取同一环境下,可用的唤醒词准确度评估值Pgz,分析两组唤醒词准确度评估值Pgz的误差绝对值,在误差范围内即可判断出唤醒口令是否准确,可准确的完成唤醒操作。 来自专利查询网

专利主权项内容

1.基于机器学习的智能语音交互误唤醒系统,该系统应用到至少两个智能语音设备和一个智能监控设备,其特征在于:该系统包括特征采集模块、验证比对模块以及执行输出模块;其中,所述特征采集模块包括第一语音采集单元、第二语音采集单元以及口型采集单元,第一语音采集单元和第二语音采集单元均用于采集语音数据,并获取唤醒词准确度评估值Pgz,所述口型采集单元用于对人体脸部进行动态图像捕捉,并提取口型动态数据;所述验证比对模块用于对唤醒词准确度评估值Pgz及口型动态数据做综合评估;所述执行输出模块根据综合评估的结果来选择是否唤醒智能语音设备。