← 返回列表

一种数字人播报风格控制方法及装置

申请号: CN202311568987.2
申请人: 北京风平智能科技有限公司
申请日期: 2023/11/22

摘要文本

本申请提供了一种数字人播报风格控制方法及装置,该方法包括基于待播报内容确定由所述数字人进行播报的节目类型;选择与所述节目类型相匹配的播报风格,所述播报风格用于表征不同节目类型的播报语调;从与所述播报风格关联的多个数字人模型中确定需要播报的一个数字人模型;获取所选择的数字人模型的语速设定值及停顿设定值;根据所述语速设定值、停顿设定值以及播报风格选择待播报内容的各分词音频;将分词音频进行语音合成。本申请可以使模型发音更符合节目场景,提高了用户体验。。关注公众号专利查询网

专利详细信息

项目 内容
专利名称 一种数字人播报风格控制方法及装置
专利类型 发明申请
申请号 CN202311568987.2
申请日 2023/11/22
公告号 CN117558259A
公开日 2024/2/13
IPC主分类号 G10L13/027
权利人 北京风平智能科技有限公司
发明人 王鹤; 宋子强; 何俊华; 林洪祥
地址 北京市通州区水仙西路99号2层01-1566

专利主权项内容

1.一种数字人播报风格控制方法,其特征在于,包括:基于待播报内容确定由所述数字人进行播报的节目类型;选择与所述节目类型相匹配的播报风格,所述播报风格用于表征不同节目类型的播报语调;从与所述播报风格关联的多个数字人模型中确定需要播报的一个数字人模型;获取所选择的数字人模型的语速设定值及停顿设定值;根据所述语速设定值、停顿设定值以及播报风格选择待播报内容的各分词音频;将分词音频进行语音合成。