← 返回列表
一种基于深度学习的海豚声音生成方法
申请人信息
- 申请人:广东海洋大学
- 申请人地址:524088 广东省湛江市麻章区海大路1号
- 发明人: 广东海洋大学
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种基于深度学习的海豚声音生成方法 |
| 专利类型 | 发明申请 |
| 申请号 | CN202410091532.4 |
| 申请日 | 2024/1/23 |
| 公告号 | CN117612513A |
| 公开日 | 2024/2/27 |
| IPC主分类号 | G10L13/027 |
| 权利人 | 广东海洋大学 |
| 发明人 | 冯子仪; 尹晓峰; 张培珍 |
| 地址 | 广东省湛江市麻章区海大路1号 |
摘要文本
本发明公开了一种基于深度学习的海豚声音生成方法,属于声音合成技术领域,本发明中采用EMD分解算法对海豚原始声音进行分解,得到多个EMD原始信号,每个EMD原始信号包含部分声音特征,再提取奇异值和时频特征,实现获取每个EMD原始信号的声音特征,采用深度学习模型处理奇异值特征矩阵和时频特征矩阵,生成EMD估计信号,将多个EMD估计信号进行叠加组合,得到海豚声音。本发明中将海豚原始声音进行了分解,使得每个EMD原始信号仅包含海豚原始声音的部分特征,数据量更少,复杂度更低,能提高生成海豚声音的精度。
专利主权项内容
1.一种基于深度学习的海豚声音生成方法,其特征在于,包括以下步骤:S1、采用EMD分解算法对海豚原始声音进行分解,得到多个EMD原始信号;S2、对每个EMD原始信号提取奇异值,构建奇异值特征矩阵;S3、对每个EMD原始信号提取时频特征,构建时频特征矩阵;S4、采用深度学习模型处理奇异值特征矩阵和时频特征矩阵,生成EMD估计信号;S5、将多个EMD估计信号进行组合,生成海豚声音。