← 返回列表

基于广义互相关的音频数据处理方法、装置及存储介质

申请号: CN202410103476.1
申请人: 中国传媒大学
申请日期: 2024/1/25

摘要文本

本发明提供一种基于广义互相关的音频数据处理方法、装置及存储介质,其中方法包括通过计算窗口取出两路音频流的当前处理数据,并分别放入到两路音频片段缓冲区;采用短时平均能量特征对所述两路音频片段缓冲区的数据进行静音段处理;采用广义互相关延迟算法对经过静音段处理的数据进行延迟估计处理,获取两路音频数据之间的延迟估计值;根据所述两路音频数据之间的延迟估计值,采用皮尔森相关系数对所述两路音频片段缓冲区的数据进行门限判决;通过状态机对延迟估计处理以及门限判决进行控制调控,实现两路音频数据对齐。利用本发明,能够解决各路音频传输延迟不确定、音频延迟实时变化的问题,从而实现各路音频数据实时精确对齐。

专利详细信息

项目 内容
专利名称 基于广义互相关的音频数据处理方法、装置及存储介质
专利类型 发明申请
申请号 CN202410103476.1
申请日 2024/1/25
公告号 CN117636907A
公开日 2024/3/1
IPC主分类号 G10L25/51
权利人 中国传媒大学
发明人 杨霏; 万欣; 杨刚; 蒋蓝祥; 袁梦莹; 淳俊源; 任格; 龚贵兴; 顾浩然
地址 北京市朝阳区定福庄东街1号

专利主权项内容

1.一种基于广义互相关的音频数据处理方法,其特征在于,包括:通过计算窗口取出两路音频流的当前处理数据,并分别放入到两路音频片段缓冲区;采用短时平均能量特征对所述两路音频片段缓冲区的数据进行静音段处理;采用广义互相关延迟算法对经过静音段处理的数据进行延迟估计处理,获取两路音频数据之间的延迟估计值;根据所述两路音频数据之间的延迟估计值,采用皮尔森相关系数对所述两路音频片段缓冲区的数据进行门限判决;通过状态机对延迟估计处理以及门限判决进行控制调控,实现两路音频数据对齐。