← 返回列表
音频识别方法、装置、系统和电子设备
摘要文本
本公开涉及一种音频识别方法、装置、系统、电子设备和存储介质,该方法包括:接收音频识别目标信息,并输入编码器模块得到目标特征向量,其中音频识别目标信息对应的类别数量为至少一个;将目标特征向量和类别数量输入参数推理模块得到模型配置参数;将模型配置参数发送到部署于终端设备的音频识别分类模型,使得音频识别分类模型基于模型配置参数进行配置,并使得终端设备接收到与音频识别目标信息相关联的音频信息后,通过音频识别分类模型得到音频识别结果。本公开实现了终端设备利用一个模型实现声音事件检测和关键词识别的两种功能,有助于终端设备功耗的降低和运行速度的提升,减少了终端设备为得到模型配置参数而进行的模型训练的消耗。
申请人信息
- 申请人:北京边锋信息技术有限公司
- 申请人地址:100088 北京市海淀区西土城1号院1号楼五层101-505
- 发明人: 北京边锋信息技术有限公司
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 音频识别方法、装置、系统和电子设备 |
| 专利类型 | 发明申请 |
| 申请号 | CN202410166366.X |
| 申请日 | 2024/2/6 |
| 公告号 | CN117711381A |
| 公开日 | 2024/3/15 |
| IPC主分类号 | G10L15/02 |
| 权利人 | 北京边锋信息技术有限公司 |
| 发明人 | 钟雨崎; 艾国; 杨作兴 |
| 地址 | 北京市海淀区西土城1号院1号楼五层101-505 |
专利主权项内容
1.一种音频识别方法,包括:接收音频识别目标信息,将所述音频识别目标信息输入编码器模块,通过所述编码器模块得到目标特征向量,其中所述音频识别目标信息对应的类别数量为至少一个;将所述目标特征向量和所述类别数量输入参数推理模块,通过所述参数推理模块得到模型配置参数;将所述模型配置参数发送到部署于终端设备的音频识别分类模型,使得所述音频识别分类模型基于所述模型配置参数进行配置,并使得所述终端设备接收到与所述音频识别目标信息相关联的音频信息后,通过所述音频识别分类模型得到音频识别结果。