基于深度学习和矢量预测的语音压缩方法及系统

申请号: CN202311743425.7

申请人: 山东省计算中心(国家超级计算济南中心)

申请日期: 2023/12/19

摘要文本

本公开提供了基于深度学习和矢量预测的语音压缩方法及系统，涉及语音信号处理技术领域，包括：获取低速率下的多帧语音信号，并预处理为语音序列；将当前帧语音序列作为第一深度网络的输入信号提取声学特征，利用所述声学特征预测下一帧语音序列的声学特征，并作为预测矢量；对原声学特征与预测矢量作差，获取差值矢量，并在设计的码本中寻找与差值矢量最匹配的量化矢量，作为残差索引传输到第二深度网络，第二深度网络根据接收的残差索引，在码本中找到相应的差值量化矢量，将差值量化矢量与预测矢量相加，得到重构矢量，对所述重构矢量解码输出合成语音，本公开提高了语音压缩编码合成的质量。

申请人信息

申请人:山东省计算中心(国家超级计算济南中心)
申请人地址:250000 山东省济南市历下区科院路19号
发明人: 山东省计算中心(国家超级计算济南中心)

专利详细信息

项目	内容
专利名称	基于深度学习和矢量预测的语音压缩方法及系统
专利类型	发明申请
申请号	CN202311743425.7
申请日	2023/12/19
公告号	CN117423348A
公开日	2024/1/19
IPC主分类号	G10L19/04
权利人	山东省计算中心(国家超级计算济南中心)
发明人	李晔; 于兴业; 吝灵霞
地址	山东省济南市历下区科院路19号

专利主权项内容

1.基于深度学习和矢量预测的语音压缩方法，其特征在于，包括：获取低速率下的多帧语音信号，并预处理为语音序列；将当前帧语音序列作为第一深度网络的输入信号提取声学特征，利用所述声学特征预测下一帧语音序列的声学特征，并作为预测矢量；对原声学特征与预测矢量作差，获取差值矢量，并在设计的码本中寻找与差值矢量最匹配的量化矢量，作为残差索引传输到第二深度网络，第二深度网络根据接收的残差索引，在码本中找到相应的差值量化矢量，将差值量化矢量与预测矢量相加，得到重构矢量，对所述重构矢量解码输出合成语音，并对生成语音的真伪通过判别器进行判断。。数据由马克团队整理

基于深度学习和矢量预测的语音压缩方法及系统

摘要文本

申请人信息

专利详细信息

专利主权项内容

热门技术领域

快速入口

专利技术资料

基于深度学习和矢量预测的语音压缩方法及系统

摘要文本

申请人信息

专利详细信息

专利主权项内容

相关专利推荐

一种焊接管路的辅助装置

一种导轨滑块刚性疲劳测试装置及其测试方法

X射线管及其阴极冷却装置、管芯组件

双歧杆菌分离培养方法

一种用于电子级硫酸生产废液的回收处理装置

自动化全内置超导磁铁磁场强度测量装置及测量方法

热门技术领域

快速入口

专利技术资料