← 返回列表
语音合成方法、系统、电子设备及介质
摘要文本
本申请提供一种语音合成方法、系统、电子设备及介质,所述方法包括:输入文本内容以获取文本词元;获取参考语音以对所述参考语音进行编码获取语音嵌入数据;对所述语音嵌入数据进行特征转换以获取语音特征矩阵;基于所述文本词元和所述语音特征矩阵获取声学词元序列;基于所述文本词元、所述语音特征矩阵和所述声学词元序列获取声学特征以进行语音合成。本申请能够同时接受文本内容和参考语音,进行语音合成,合成后的语音说话内容为文本内容,风格为参考语音风格,包括说话风格、声音和环境。本申请有效降低了语音合成的难度,并且提高了合成语言的人化程度,情感真实且自然。。关注公众号马 克 数 据 网
申请人信息
- 申请人:上海蜜度科技股份有限公司
- 申请人地址:201204 上海市浦东新区中国(上海)自由贸易试验区张衡路198弄10号301AB室
- 发明人: 上海蜜度科技股份有限公司
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 语音合成方法、系统、电子设备及介质 |
| 专利类型 | 发明申请 |
| 申请号 | CN202410182277.4 |
| 申请日 | 2024/2/19 |
| 公告号 | CN117765926A |
| 公开日 | 2024/3/26 |
| IPC主分类号 | G10L13/08 |
| 权利人 | 上海蜜度科技股份有限公司 |
| 发明人 | 孔欧 |
| 地址 | 上海市浦东新区中国(上海)自由贸易试验区张衡路198弄10号301AB室 |
专利主权项内容
1.一种语音合成方法,其特征在于,包括:输入文本内容以获取文本词元;获取参考语音以对所述参考语音进行编码获取语音嵌入数据;对所述语音嵌入数据进行特征转换以获取语音特征矩阵;基于所述文本词元和所述语音特征矩阵获取声学词元序列;基于所述文本词元、所述语音特征矩阵和所述声学词元序列获取声学特征以进行语音合成。