← 返回列表

基于扩散模型的音乐音色风格转换方法及系统

申请号: CN202410001371.5
申请人: 广州市车厘子电子科技有限公司
更新日期: 2026-03-17

专利详细信息

项目 内容
专利名称 基于扩散模型的音乐音色风格转换方法及系统
专利类型 发明申请
申请号 CN202410001371.5
申请日 2024/1/2
公告号 CN117496927A
公开日 2024/2/2
IPC主分类号 G10H1/00
权利人 广州市车厘子电子科技有限公司
发明人 秦先清; 徐婉微; 何志辉
地址 广东省广州市花都区迎宾大道173号之十一501

摘要文本

本发明公开了基于扩散模型的音乐音色风格转换方法及系统,包括:构建潜在扩散模型,获取输入文本信息进行标记化及参数化处理,获取与风格音乐对应的嵌入向量;在潜在扩散模型中引入交叉注意力机制的学习方法,获取风格音乐的关键信息,并给出学习的对应文本嵌入向量,通过训练输出符合预设标准的潜在扩散模型;获取目标内容音乐,通过潜在扩散模型将随机噪声添加至所述目标内容音乐,并利用潜在扩散模型的反向过程进行去噪,生成以输入文本为条件的编码后的新音乐。本发使用潜在扩散模型来进行音乐音色风格迁移,直接从风格音乐中学习艺术风格,然后指导合成,能够高效、准确地学习音乐中的关键信息,从而捕捉和转换音乐的流派风格。

专利主权项内容

1.一种基于扩散模型的音乐音色风格转换方法,其特征在于,包括以下步骤:构建潜在扩散模型,获取输入文本信息,将所述文本信息进行标记化及参数化处理,获取与风格音乐对应的嵌入向量;在所述潜在扩散模型中引入交叉注意力机制的学习方法,获取风格音乐的关键信息,并给出学习的对应文本嵌入向量,对所述潜在扩散模型进行训练,输出符合预设标准的潜在扩散模型;获取目标内容音乐,通过潜在扩散模型将随机噪声添加至所述目标内容音乐,并利用潜在扩散模型的反向过程进行去噪,生成以输入文本为条件的编码后的新音乐。。来源:百度搜索马克数据网