← 返回列表

基于语音迁移学习的新闻播报个性化音频生成系统及方法

申请号: CN202410186876.3
申请人: 卓世未来(天津)科技有限公司
申请日期: 2024/2/20

摘要文本

本发明提供一种基于语音迁移学习的新闻播报个性化音频生成系统及方法,属于语音合成技术领域。所述系统包括:数据采集模块,用于获取用户偏好新闻播报音频合集及播报新闻音频文本;特征提取模块,用于对获取的数据进行特征提取,得到音频声音特征信息及文本特征信息;第一确定模块,用于计算出个性化播报语音选择系数;第二确定模块,用于计算出个性化新闻文本内容选择系数;音频合成播报模块,用于根据个性化播报语音选择系数与个性化新闻文本内容选择系数确定用户个性化音频调控指数,为用户定制个性化新闻音频播报;用户界面,用于为用户提供偏好更改功能,满足用户个性化新闻播报需求。采用本发明,能够精准推荐用户个性化新闻播报音频。

专利详细信息

项目 内容
专利名称 基于语音迁移学习的新闻播报个性化音频生成系统及方法
专利类型 发明申请
申请号 CN202410186876.3
申请日 2024/2/20
公告号 CN117743630A
公开日 2024/3/22
IPC主分类号 G06F16/635
权利人 卓世未来(天津)科技有限公司
发明人 屠静; 王亚; 赵策; 潘亮亮; 李伟伟; 苏岳; 孙岩; 颉彬; 万晶晶; 张玥
地址 天津市武清区武清开发区福源道北侧创业总部基地C02号楼313室33号

专利主权项内容

1.一种基于语音迁移学习的新闻播报个性化音频生成系统,其特征在于,所述系统包括:数据采集模块,用于获取用户偏好新闻播报音频合集及播报新闻音频文本;特征提取模块,用于对获取的用户偏好新闻播报音频合集及播报新闻音频文本进行预处理及特征提取,得到音频声音特征信息及文本特征信息;第一确定模块,用于根据音频声音特征信息计算出个性化播报语音选择系数,其中,所述个性化播报语音选择系数用于选择用户喜好播报语音特征;第二确定模块,用于根据文本特征信息计算出个性化新闻文本内容选择系数,其中,所述个性化新闻文本内容选择系数用于选择用户个性化新闻内容;音频合成播报模块,用于根据个性化播报语音选择系数与个性化新闻文本内容选择系数确定用户个性化音频调控指数,通过用户个性化音频调控指数为用户定制个性化新闻音频播报;用户界面,用于为用户提供偏好更改功能,满足用户个性化新闻播报需求。。 (macrodatas.cn)