基于广义互相关的音频数据处理方法、装置及存储介质

申请号: CN202410103476.1

申请人: 中国传媒大学

申请日期: 2024/1/25

摘要文本

本发明提供一种基于广义互相关的音频数据处理方法、装置及存储介质，其中方法包括通过计算窗口取出两路音频流的当前处理数据，并分别放入到两路音频片段缓冲区；采用短时平均能量特征对所述两路音频片段缓冲区的数据进行静音段处理；采用广义互相关延迟算法对经过静音段处理的数据进行延迟估计处理，获取两路音频数据之间的延迟估计值；根据所述两路音频数据之间的延迟估计值，采用皮尔森相关系数对所述两路音频片段缓冲区的数据进行门限判决；通过状态机对延迟估计处理以及门限判决进行控制调控，实现两路音频数据对齐。利用本发明，能够解决各路音频传输延迟不确定、音频延迟实时变化的问题，从而实现各路音频数据实时精确对齐。

申请人信息

申请人:中国传媒大学
申请人地址:100024 北京市朝阳区定福庄东街1号
发明人: 中国传媒大学

专利详细信息

项目	内容
专利名称	基于广义互相关的音频数据处理方法、装置及存储介质
专利类型	发明申请
申请号	CN202410103476.1
申请日	2024/1/25
公告号	CN117636907A
公开日	2024/3/1
IPC主分类号	G10L25/51
权利人	中国传媒大学
发明人	杨霏; 万欣; 杨刚; 蒋蓝祥; 袁梦莹; 淳俊源; 任格; 龚贵兴; 顾浩然
地址	北京市朝阳区定福庄东街1号

专利主权项内容

1.一种基于广义互相关的音频数据处理方法，其特征在于，包括：通过计算窗口取出两路音频流的当前处理数据，并分别放入到两路音频片段缓冲区；采用短时平均能量特征对所述两路音频片段缓冲区的数据进行静音段处理；采用广义互相关延迟算法对经过静音段处理的数据进行延迟估计处理，获取两路音频数据之间的延迟估计值；根据所述两路音频数据之间的延迟估计值，采用皮尔森相关系数对所述两路音频片段缓冲区的数据进行门限判决；通过状态机对延迟估计处理以及门限判决进行控制调控，实现两路音频数据对齐。

基于广义互相关的音频数据处理方法、装置及存储介质

摘要文本

申请人信息

专利详细信息

专利主权项内容

热门技术领域

快速入口

专利技术资料

基于广义互相关的音频数据处理方法、装置及存储介质

摘要文本

申请人信息

专利详细信息

专利主权项内容

相关专利推荐

一种全光产品的质量检测方法及系统

一种3D打印机脱料装置

一种基于试验数据库的压气机性能仿真程序精度评估方法

一种基于灰盒模型的节流阀响应预测方法

一种用于水性工业漆的加工装置

双辐板涡轮盘

热门技术领域

快速入口

专利技术资料