← 返回列表

一种基于深度学习的海豚声音生成方法

申请号: CN202410091532.4
申请人: 广东海洋大学
更新日期: 2026-03-17

专利详细信息

项目 内容
专利名称 一种基于深度学习的海豚声音生成方法
专利类型 发明申请
申请号 CN202410091532.4
申请日 2024/1/23
公告号 CN117612513A
公开日 2024/2/27
IPC主分类号 G10L13/027
权利人 广东海洋大学
发明人 冯子仪; 尹晓峰; 张培珍
地址 广东省湛江市麻章区海大路1号

摘要文本

本发明公开了一种基于深度学习的海豚声音生成方法,属于声音合成技术领域,本发明中采用EMD分解算法对海豚原始声音进行分解,得到多个EMD原始信号,每个EMD原始信号包含部分声音特征,再提取奇异值和时频特征,实现获取每个EMD原始信号的声音特征,采用深度学习模型处理奇异值特征矩阵和时频特征矩阵,生成EMD估计信号,将多个EMD估计信号进行叠加组合,得到海豚声音。本发明中将海豚原始声音进行了分解,使得每个EMD原始信号仅包含海豚原始声音的部分特征,数据量更少,复杂度更低,能提高生成海豚声音的精度。

专利主权项内容

1.一种基于深度学习的海豚声音生成方法,其特征在于,包括以下步骤:S1、采用EMD分解算法对海豚原始声音进行分解,得到多个EMD原始信号;S2、对每个EMD原始信号提取奇异值,构建奇异值特征矩阵;S3、对每个EMD原始信号提取时频特征,构建时频特征矩阵;S4、采用深度学习模型处理奇异值特征矩阵和时频特征矩阵,生成EMD估计信号;S5、将多个EMD估计信号进行组合,生成海豚声音。