← 返回列表

基于知识蒸馏的音频降噪模型的训练方法、装置及设备

申请号: CN202410051095.3
申请人: 京东城市(北京)数字科技有限公司; 北京市大数据中心
申请日期: 2024/1/12

摘要文本

本申请公开了一种基于知识蒸馏的音频降噪模型的训练方法、装置及设备,涉及人工智能技术领域。该方法的一具体实施方式包括:将具有噪声的音频信号从时域转换至时频域,得到具有噪声的音频特征;分别将具有噪声的音频特征输入到教师网络和学生网络中,得到教师网络预测输出的第一降噪特征,以及学生网络预测输出的第二降噪特征;将第二降噪特征从时频域转换至时域,得到第二降噪信号;根据第二降噪信号与干净的音频信号,第二降噪特征与干净的音频特征,以及第二降噪特征和第一降噪特征,确定学生网络对应的损失函数;利用学生网络对应的损失函数对学生网络进行知识蒸馏训练,得到训练后的音频降噪模型。

专利详细信息

项目 内容
专利名称 基于知识蒸馏的音频降噪模型的训练方法、装置及设备
专利类型 发明申请
申请号 CN202410051095.3
申请日 2024/1/12
公告号 CN117577124A
公开日 2024/2/20
IPC主分类号 G10L21/0216
权利人 京东城市(北京)数字科技有限公司; 北京市大数据中心
发明人 王鑫磊; 李丽勤; 赵婉; 张钧波; 郭瑾瑾; 宋礼; 水治禹
地址 北京市海淀区知春路76号(写字楼)1号楼9层1-7-5号; 北京市通州区潞城镇宏安街9号

专利主权项内容

1.一种基于知识蒸馏的音频降噪模型的训练方法,其中,所述训练方法包括:将具有噪声的音频信号从时域转换至时频域,得到具有噪声的音频特征;分别将具有噪声的音频特征输入到教师网络和学生网络中,得到所述教师网络预测输出的第一降噪特征,以及所述学生网络预测输出的第二降噪特征;将所述第二降噪特征从时频域转换至时域,得到第二降噪信号;根据所述第二降噪信号与干净的音频信号之间的损失函数,所述第二降噪特征与干净的音频特征之间的损失函数,以及所述第二降噪特征和所述第一降噪特征之间的蒸馏损失函数,确定所述学生网络对应的损失函数;利用所述学生网络对应的损失函数对所述学生网络进行知识蒸馏训练,得到训练后的音频降噪模型。 来自马-克-数-据