← 返回列表
一种数字人播报风格控制方法及装置
摘要文本
本申请提供了一种数字人播报风格控制方法及装置,该方法包括基于待播报内容确定由所述数字人进行播报的节目类型;选择与所述节目类型相匹配的播报风格,所述播报风格用于表征不同节目类型的播报语调;从与所述播报风格关联的多个数字人模型中确定需要播报的一个数字人模型;获取所选择的数字人模型的语速设定值及停顿设定值;根据所述语速设定值、停顿设定值以及播报风格选择待播报内容的各分词音频;将分词音频进行语音合成。本申请可以使模型发音更符合节目场景,提高了用户体验。。关注公众号专利查询网
申请人信息
- 申请人:北京风平智能科技有限公司
- 申请人地址:101100 北京市通州区水仙西路99号2层01-1566
- 发明人: 北京风平智能科技有限公司
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种数字人播报风格控制方法及装置 |
| 专利类型 | 发明申请 |
| 申请号 | CN202311568987.2 |
| 申请日 | 2023/11/22 |
| 公告号 | CN117558259A |
| 公开日 | 2024/2/13 |
| IPC主分类号 | G10L13/027 |
| 权利人 | 北京风平智能科技有限公司 |
| 发明人 | 王鹤; 宋子强; 何俊华; 林洪祥 |
| 地址 | 北京市通州区水仙西路99号2层01-1566 |
专利主权项内容
1.一种数字人播报风格控制方法,其特征在于,包括:基于待播报内容确定由所述数字人进行播报的节目类型;选择与所述节目类型相匹配的播报风格,所述播报风格用于表征不同节目类型的播报语调;从与所述播报风格关联的多个数字人模型中确定需要播报的一个数字人模型;获取所选择的数字人模型的语速设定值及停顿设定值;根据所述语速设定值、停顿设定值以及播报风格选择待播报内容的各分词音频;将分词音频进行语音合成。