基于频率调制的人声合成方法、装置、设备及存储介质

申请号: CN202311721535.3

申请人: 深圳市声菲特科技技术有限公司

更新日期: 2026-03-09

摘要文本

深圳市声菲特科技技术有限公司取得“一种透气窗帘布”专利技术，本发明涉及数据处理的技术领域，公开了一种基于频率调制的人声合成方法、装置、设备及存储介质。所述基于频率调制的人声合成方法包括：通过目标设备获取源人声信号，并对所述源人声信号进行预处理，得到目标信号；通过预设的第一分析算法对所述目标信号进行第一分析，得到人声音色参数，并通过预设的第二分析算法对所述目标信号进行第二分析，得到人声语义信息；基于所述人声语义信息和所述人声音色参数，从预设的参数数据库中匹配对应的调制参数；本发明不仅确保了人声信号处理的准确性和效率，而且通过精确的特征提取、高效的参数匹配、个性化的声音重构以及全面的声音评估，大大提高了重构语音的质量和用户满意度。

专利主权项内容

1.一种基于频率调制的人声合成方法，其特征在于，包括以下步骤：通过目标设备获取源人声信号，并对所述源人声信号进行预处理，得到目标信号；其中，所述预处理至少包括模数转换；通过预设的第一分析算法对所述目标信号进行第一分析，得到人声音色参数，并通过预设的第二分析算法对所述目标信号进行第二分析，得到人声语义信息；其中，所述第一分析为谐波分析，所述第二分析为语义提取分析；基于所述人声语义信息和所述人声音色参数，从预设的参数数据库中匹配对应的调制参数；其中，数据库中提前存储有所述人声语义信息、所述人声音色参数与所述调制参数的匹配规则；获取初始的声音重构模型，并基于匹配的所述调制参数调整初始的声音重构模型的参数，得到调整后的声音重构模型；将所述目标信号输入至调整后的声音重构模型中，得到重构语音，并对所述重构语音与所述源人声信号进行评估分析，得到所述重构语音的音质报告；所述目标设备的选取过程，包括：发送基于无线频率识别的近场通信协议至有源声音地理坐标的初始设备，接收初始设备电子标签反馈的加密认证信息；通过预设的深度学习算法对接收到的加密认证信息进行实时解析，得到解析数据，从所述解析数据中获取采集的数据包，将所述数据包解析为制造商识别块、数据保护框架块和检索识别块；通过训练后的深度神经网络模型解码制造商识别块中的制造商特征信息，并对比预设的制造商数据库，找到与制造商特征信息相关的数据表；从数据保护框架块中解析出初始设备的数据加密框架，并通过预设的哈希函数对数据加密框架进行哈希运算，生成唯一哈希标签；在所述数据表中筛选包含唯一哈希标签的数据列；其中，所述数据列包括多个具有数据采集权限的初始设备及其对应的编码；基于训练后的文本相似性评价模型，将每个初始设备对应的编码与检索识别块进行字符级别的相似性评估，选拔出与检索识别块的字符级别相似度高于设定阈值的设备作为采集源人声信号的目标设备。

专利申请信息

项目	内容
专利名称	基于频率调制的人声合成方法、装置、设备及存储介质
专利类型	发明授权
申请号	CN202311721535.3
申请日	2023/12/14
公告号	CN117409761B
公开日	2024/3/15
IPC主分类号	G10L13/027
权利人	深圳市声菲特科技技术有限公司
发明人	熊悦; 李庆余; 熊晨阳; 黄智
地址	广东省深圳市光明区凤凰街道塘尾社区光明大道380号尚智科技园1栋B座901

基于频率调制的人声合成方法、装置、设备及存储介质

摘要文本

专利主权项内容

专利申请信息

热门技术领域

快速入口

专利技术资料

基于频率调制的人声合成方法、装置、设备及存储介质

摘要文本

专利主权项内容

专利申请信息

相关专利推荐

一种调弯驱动装置及内窥镜

具有开路电压保护功能的光伏逆变器组件及光伏逆变器

一种端基修饰的阳离子聚酯、活体递送体系及应用

热门技术领域

快速入口

专利技术资料