← 返回列表
基于扩散模型的音乐音色风格转换方法及系统
申请人信息
- 申请人:广州市车厘子电子科技有限公司
- 申请人地址:510801 广东省广州市花都区迎宾大道173号之十一501
- 发明人: 广州市车厘子电子科技有限公司
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 基于扩散模型的音乐音色风格转换方法及系统 |
| 专利类型 | 发明申请 |
| 申请号 | CN202410001371.5 |
| 申请日 | 2024/1/2 |
| 公告号 | CN117496927A |
| 公开日 | 2024/2/2 |
| IPC主分类号 | G10H1/00 |
| 权利人 | 广州市车厘子电子科技有限公司 |
| 发明人 | 秦先清; 徐婉微; 何志辉 |
| 地址 | 广东省广州市花都区迎宾大道173号之十一501 |
摘要文本
本发明公开了基于扩散模型的音乐音色风格转换方法及系统,包括:构建潜在扩散模型,获取输入文本信息进行标记化及参数化处理,获取与风格音乐对应的嵌入向量;在潜在扩散模型中引入交叉注意力机制的学习方法,获取风格音乐的关键信息,并给出学习的对应文本嵌入向量,通过训练输出符合预设标准的潜在扩散模型;获取目标内容音乐,通过潜在扩散模型将随机噪声添加至所述目标内容音乐,并利用潜在扩散模型的反向过程进行去噪,生成以输入文本为条件的编码后的新音乐。本发使用潜在扩散模型来进行音乐音色风格迁移,直接从风格音乐中学习艺术风格,然后指导合成,能够高效、准确地学习音乐中的关键信息,从而捕捉和转换音乐的流派风格。
专利主权项内容
1.一种基于扩散模型的音乐音色风格转换方法,其特征在于,包括以下步骤:构建潜在扩散模型,获取输入文本信息,将所述文本信息进行标记化及参数化处理,获取与风格音乐对应的嵌入向量;在所述潜在扩散模型中引入交叉注意力机制的学习方法,获取风格音乐的关键信息,并给出学习的对应文本嵌入向量,对所述潜在扩散模型进行训练,输出符合预设标准的潜在扩散模型;获取目标内容音乐,通过潜在扩散模型将随机噪声添加至所述目标内容音乐,并利用潜在扩散模型的反向过程进行去噪,生成以输入文本为条件的编码后的新音乐。。来源:百度搜索马克数据网