← 返回列表

音频处理方法、装置、电子设备及存储介质

申请号: CN202210835546.3
申请人: 北京达佳互联信息技术有限公司
申请日期: 2022/7/15

摘要文本

本公开提供了一种音频处理方法、装置、电子设备及存储介质,属于信号处理技术领域。该方法包括:采集音频数据;按照目标内容分类方式对该音频数据进行内容分类,得到该音频数据的内容类别;在与目标内容分类方式匹配的码率表中,获取与该内容类别匹配的目标码率;根据目标码率对该音频数据进行编码处理。本公开实施例会对音频数据进行内容分类,进而对不同类别的音频数据使用不同的码率进行编码,该种音频处理方案更为灵活和合理,能够节省音频传输时的网络带宽,避免了采用相同的高码率对各种类型的音频数据进行统一编码的带宽浪费问题。

专利详细信息

项目 内容
专利名称 音频处理方法、装置、电子设备及存储介质
专利类型 发明授权
申请号 CN202210835546.3
申请日 2022/7/15
公告号 CN115334349B
公开日 2024/1/2
IPC主分类号 H04N21/439
权利人 北京达佳互联信息技术有限公司
发明人 任新蕾; 郑羲光; 陈联武; 张晨
地址 北京市海淀区西二旗西路16号院12号楼8层101

专利主权项内容

1.一种音频处理方法,其特征在于,所述方法包括:采集音频数据;响应于目标内容分类方式为第三内容分类方式,基于内容分类模型,对当前时间窗口内的音频数据进行内容分类,得到第一分类结果,所述第一分类结果为基于所述内容分类模型得到的细分类结果;所述内容分类模型是根据样本音频数据和所述样本音频数据的样本分类标签训练得到的;获取目标音频帧的第二分类结果,所述目标音频帧是下一个时间窗口内的音频数据,所述第二分类结果为基于音频数据中音频帧的能量得到的粗分类结果;根据所述第一分类结果和所述第二分类结果,确定下一个时间窗口内的音频数据的内容类别,所述内容类别为背景噪声、背景音乐或用户语音;在与所述第三内容分类方式匹配的第三码率表中,获取与所述内容类别匹配的目标码率;根据所述目标码率对所述下一个时间窗口内的音频数据进行编码处理。