基于扩散模型的音乐音色风格转换方法及系统

申请号: CN202410001371.5

申请人: 广州市车厘子电子科技有限公司

更新日期: 2026-03-17

摘要文本

广州市车厘子电子科技有限公司取得“一种透气窗帘布”专利技术，本发明公开了基于扩散模型的音乐音色风格转换方法及系统，包括：构建潜在扩散模型，获取输入文本信息进行标记化及参数化处理，获取与风格音乐对应的嵌入向量；在潜在扩散模型中引入交叉注意力机制的学习方法，获取风格音乐的关键信息，并给出学习的对应文本嵌入向量，通过训练输出符合预设标准的潜在扩散模型；获取目标内容音乐，通过潜在扩散模型将随机噪声添加至所述目标内容音乐，并利用潜在扩散模型的反向过程进行去噪，生成以输入文本为条件的编码后的新音乐。本发使用潜在扩散模型来进行音乐音色风格迁移，直接从风格音乐中学习艺术风格，然后指导合成，能够高效、准确地学习音乐中的关键信息，从而捕捉和转换音乐的流派风格。

专利主权项内容

1.一种基于扩散模型的音乐音色风格转换方法，其特征在于，包括以下步骤：构建潜在扩散模型，获取输入文本信息，将所述文本信息进行标记化及参数化处理，获取与风格音乐对应的嵌入向量；在所述潜在扩散模型中引入交叉注意力机制的学习方法，获取风格音乐的关键信息，并给出学习的对应文本嵌入向量，对所述潜在扩散模型进行训练，输出符合预设标准的潜在扩散模型；获取目标内容音乐，通过潜在扩散模型将随机噪声添加至所述目标内容音乐，并利用潜在扩散模型的反向过程进行去噪，生成以输入文本为条件的编码后的新音乐。。来源：百度搜索马克数据网

专利申请信息

项目	内容
专利名称	基于扩散模型的音乐音色风格转换方法及系统
专利类型	发明申请
申请号	CN202410001371.5
申请日	2024/1/2
公告号	CN117496927A
公开日	2024/2/2
IPC主分类号	G10H1/00
权利人	广州市车厘子电子科技有限公司
发明人	秦先清; 徐婉微; 何志辉
地址	广东省广州市花都区迎宾大道173号之十一501

基于扩散模型的音乐音色风格转换方法及系统

摘要文本

专利主权项内容

专利申请信息

热门技术领域

快速入口

专利技术资料

基于扩散模型的音乐音色风格转换方法及系统

摘要文本

专利主权项内容

专利申请信息

相关专利推荐

一种迷你安全型PTC起动器

一种人员安全转移救援舱的控制系统

一种超高强钢与高强钢焊接结构焊接系统及其应用方法

一种抗静电乳胶手套及其制备方法

一种基于物联网的物流运输监控系统

一种可实现色彩增强的镜片及其制备方法

热门技术领域

快速入口

专利技术资料