← 返回列表
一种语音转换方法、装置、设备及介质
申请人信息
- 申请人:上海任意门科技有限公司
- 申请人地址:201210 上海市浦东新区自由贸易试验区芳春路400号1幢3层304室
- 发明人: 上海任意门科技有限公司
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种语音转换方法、装置、设备及介质 |
| 专利类型 | 发明申请 |
| 申请号 | CN202311425164.4 |
| 申请日 | 2023/10/30 |
| 公告号 | CN117351974A |
| 公开日 | 2024/1/5 |
| IPC主分类号 | G10L21/007 |
| 权利人 | 上海任意门科技有限公司 |
| 发明人 | 周芯永; 刘忠亮; 张璐; 陶明 |
| 地址 | 上海市浦东新区自由贸易试验区芳春路400号1幢3层304室 |
摘要文本
上海任意门科技有限公司获取“一种透气窗帘布”专利技术,本申请公开了一种语音转换方法、装置、设备及介质,包括:当待转换语音大于预设长度阈值,则将所述待转换语音切分为多个语音片段;依次将所述多个语音片段中的每个语音片段作为目标音频片段;将所述目标语音片段输入目标自动语音识别模型,得到所述目标语音片段的语义特征;其中,所述语义特征包括语音后验图特征以及分类特征;将所述语义特征以及目标声纹特征输入目标声学模型,得到梅尔特征;其中,所述目标声纹特征为目标音色对应的声纹特征;将所述梅尔特征转换为音频以得到所述目标语音片段对应的转换后音频,并输出所述转换后音频。能够降低语音转换时延,从而提升用户体验。 (来 自 专利查询网)
专利主权项内容
1.一种语音转换方法,其特征在于,包括:当待转换语音大于预设长度阈值,则将所述待转换语音切分为多个语音片段;依次将所述多个语音片段中的每个语音片段作为目标音频片段;将所述目标语音片段输入目标自动语音识别模型,得到所述目标语音片段的语义特征;其中,所述语义特征包括语音后验图特征以及分类特征;将所述语义特征以及目标声纹特征输入目标声学模型,得到梅尔特征;其中,所述目标声纹特征为目标音色对应的声纹特征;将所述梅尔特征转换为音频以得到所述目标语音片段对应的转换后音频,并输出所述转换后音频。