首页 > 乐器声学 专利正文
语音播报方法、装置、系统、设备和计算机可读介质与流程

时间:2022-02-24 阅读: 作者:专利查询

语音播报方法、装置、系统、设备和计算机可读介质与流程

1.本公开实施例涉及音频处理技术领域,特别涉及一种语音播报方法、装置、系统、设备和计算机可读介质。


背景技术:

2.随着计算机技术的发展和普及,人机交互等智能技术在人们生活的各个方面提供方便快捷的服务。文本转语音(text to speech,tts)技术能够实现从文本到语音的转换,是人工智能技术中人机交互的重要技术。
3.在语音播报过程中,通常会对所要播报的tts内容采用统一的播报策略,即播报参数完全一致。使用完全一致的播报参数,播报参数的设置方式单一,且容易造成重要的tts内容容易被遗漏。


技术实现要素:

4.本公开实施例提供一种语音播报方法、装置、系统、设备和计算机可读介质,可以对不同的语音播报内容设置差异化的播报参数,从而突出不同的语音播报内容,提高用户体验。
5.第一方面,本公开实施例提供一种语音播报方法,包括:设置语音播报指令中每条语音播报内容的优先级参数信息;根据优先级参数信息,调整每条语音播报内容的播报参数;按照调整后的播报参数,播报每条语音播报内容。
6.第二方面,本公开实施例提供一种语音播报装置,包括:参数确定模块,用于确定语音播报指令中每条语音播报内容的优先级参数信息;参数调整模块,用于根据优先级参数信息,调整每条语音播报内容的播报参数,得到每条语音播报内容的调整后的播报参数;内容播报模块,用于按照调整后的播报参数,播报每条语音播报内容。
7.第三方面,本公开实施例提供一种语音播报系统,包括:指令接收装置,用于接收语音播报指令,语音播报指令中包括至少一条语音播报内容;语音播报装置,用于根据接收的语音播报指令,执行上述任意一种语音播报方法。
8.第四方面,本公开实施例提供一种语音播报设备,其包括:一个或多个处理器;存储器,其上存储有一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器上述任意一种语音播报方法;一个或多个i/o接口,连接在处理器与存储器之间,配置为实现处理器与存储器的信息交互。
9.第五方面,本公开实施例提供一种计算机可读介质,其上存储有计算机程序,程序被处理器执行时实现上述任意一种语音播报方法。
10.本公开实施例提供的语音播报方法、装置、系统、设备和计算机可读介质,可以对语音播报指令中的每一条语音播报内容设置优先级参数信息,并根据设置的优先级参数信息调节每条语音播报内容的播报参数,对不同的语音播报内容设置差异化的播报参数,从而突出不同的语音播报内容,提高用户体验。
附图说明
11.附图用来提供对本公开实施例的进一步理解,并且构成说明书的一部分,与本公开的实施例一起用于解释本公开,并不构成对本公开的限制。通过参考附图对详细示例实施例进行描述,以上和其它特征和优点对本领域技术人员将变得更加显而易见,在附图中:
12.图1为本公开实施例提供的一种场景示意图;
13.图2为本公开实施例提供的一种语音播报方法的流程图;
14.图3为本公开实施例提供的另一语音播报方法的流程图;
15.图4为本公开实施例提供的一种语音播报装置的组成框图;
16.图5为本公开实施例提供的一种语音播报系统的组成框图;
17.图6为本公开实施例提供的一种语音播报设备的组成框图;
18.图7为本公开实施例提供的一种计算机可读介质的组成框图。
具体实施方式
19.为使本领域的技术人员更好地理解本公开的技术方案,下面结合附图对本公开提供的语音播报方法、装置、系统、设备和计算机可读介质进行详细描述。
20.在下文中将参考附图更充分地描述示例实施例,但是示例实施例可以以不同形式来体现且不应当被解释为限于本文阐述的实施例。反之,提供这些实施例的目的在于使本公开透彻和完整,并将使本领域技术人员充分理解本公开的范围。在不冲突的情况下,本公开各实施例及实施例中的各特征可相互组合。
21.tts是语音合成应用的一种,它将储存于电脑中的文件或文本内容转换成自然语音输出。tts不仅能帮助用于阅读计算机上的信息,更能增加文本文档的可读性。
22.图1为本公开实施例的语音播报方法的一个场景示意图。如图1所示,该场景中包括用户10以及语音播报设备20。
23.在语音导航场景中,语音播报设备20可以根据接收的目的地信息,生成导航信息,并利用文本转语音技术,生成导航信息对应的语音播报指令,向用户10播报该语音播报指令中的语音播报内容,使用户10可以在车辆行进过程中实时获取该语音播报的行车路线和路况信息。
24.在本公开实施例中,语音播报方法不仅可以应用于语音导航场景,还可以应用于人工智能交互场景和纯语音应用的播报等使用场景中。
25.在人工智能交互场景中,人工智能设备接收音频信号,并可以对音频信号进行音频处理产生交互信息,此时,需要对产生的交互信息进行语音播报。
26.在其他纯语音应用的播报场景中,可以对天气信息的严重程度进行播报、对文章和笑话等文本内容的播报,也可以对日程信息等内容进行播报。应理解,语音播报内容可以是任何以语音播报形式进行播报的内容,根据实际场景的不同,语音播报内容可以有所不同,本公开实施例不做具体限定。
27.在语音播报时,对于每一个所要播报的语音播报内容,如果采用统一的播报策略,对每条语音播报内容的播报参数不作任何区分,这种情况下,对于某些重要的tts内容,有时候很容易就会被用户遗漏掉。
28.图2示出本公开实施例的一种语音播报方法的流程图。如图2所示,在一个实施例
中,该语音播报方法可以包括如下步骤。
29.s110,设置语音播报指令中每条语音播报内容的优先级参数信息。
30.s120,根据优先级参数信息,调整每条语音播报内容的播报参数。
31.s130,按照调整后的播报参数,播报每条语音播报内容。
32.根据本公开实施例的语音播报方法,可以对语音播报指令中的每一条语音播报内容设置优先级参数信息,并根据设置的优先级参数信息调节每条语音播报内容的播报参数,对不同的语音播报内容设置差异化的播报参数,从而突出不同的语音播报内容,并提高用户体验。
33.在一个实施例中,步骤s110之前还可以包括:s11,接收语音播报指令,其中,语音播报指令中可以包含至少一条语音播报内容。
34.在本公开实施例中,语音播报指令中的语音播报内容可以是任何以语音播报的形式输出的内容。在一个实施例中,该语音播报内容包括但不限于是:语音导航系统所产生的导航信息对应的播报内容、人工智能交互系统产生的交互信息对应的播报内容、或者其他纯语音应用中的播报内容。
35.其中,在人工智能交互系统产生的交互信息对应的播报内容中,该交互信息可以是根据用户输入的音频信号产生的交互信息;在其他纯语音应用中的播报内容中,该播报内容包括但不限于是:对文章、笑话等文本内容的播报、天气信息的严重程度的播报、或者临近期限的日程播报等。
36.在上述实施例中,语音播报指令可以是导航系统产生的播报指令,用于通过语音提供路线导航信息;或者,语音播报指令可以是人工智能交互系统产生的播报指令,用于提供语音交互信息;或者,语音播报指令可以是纯语音应用中的播报内容对应的播报指令。
37.应理解,上述语音播报内容的示例仅仅是示意性的,根据实际应用需要,语音播报内容可以是任何以语音播报的形式输出的内容,具体可以根据实际应用场景灵活配置,此方面内容不做限制。
38.在一个实施例中,步骤s110具体可以包括:s21,从每条语音播报内容中提取特定重要信息;s22,对包含特定重要信息的语音播报内容,设置与特定重要性信息对应的优先级参数信息。
39.在该实施例中,对未提取到特定重要信息的语音播报内容,可以设备优先级参数信息与该原有的播报参数信息一致。
40.在一个实施例中,该优先级参数信息也可以在播报之前,由用户人工设置或自定义设置。
41.在一个实施例中,语音播报内容包括导航信息对应的播报内容时,特定重要信息例如可以包括:特定路况信息或特定路口信息。特定路况信息例如可以包括弯道信息、道路施工信息、道路事故信息等,特定路口例如可以包括红绿灯路口,导航信息中前往目的地的重要路口等。
42.在一些实施例中,语音播报内容中的特定重要信息,例如还可以包括:天气预警信息、灾害性天气信息、临近期限的日程信息等。在本公开实施例中,语音播报内容中的特定重要信息也可以在使用导航系统、人工智能交互系统或其他纯语音应用之前,由用户根据实际情况进行预先设置的特定信息,本公开实施例不做具体限定。
43.在一个实施例中,优先级参数信息的类别包括:语音特征参数和提示音特征参数中的至少一种。
44.具体地,语音特征参数包括:音速、音量、音调、音高、音色和响度中的至少一种;和/或,提示音特征参数包括:提示音内容、提示音时长和提示音重复次数中的至少一种。
45.在该实施例中,作为一个示例,若某一条语音播报内容中包括特定重要信息,可以适当地加大播报音量或者其他警示音等,来告知此语音播报内容的重要性。
46.例如,在导航过程中,我们可以在弯道或者红绿灯路口通过此策略来警示用户该如何行驶,以便提前作出反应;在天气信息的播报过程中,通过次策略警示用户注意防范天气预警信息,以便提前制定出行计划等。
47.在一个实施例中,步骤s120具体可以包括:s31,对优先级参数信息进行分类,得到优先级参数信息的类别;s32,按照类别,分别调整每个类别中所包含的每条语音播报内容的播报参数。
48.在该实施例中,对优先级参数信息进行分类后,可以每次调整同一类别的参数,例如先批量调音量等语音特征参数,再批量增加提示音,每次只调节一个类型,可以避免频繁切换设定的类别,提高播报参数的调节效率。
49.根据本公开实施例的语音播报方法,可以根据语音播报内容优先级去修改播报的相关参数,及时地警示用户做出响应,避免用户错过一些重要的tts内容,大大提升了用户使用体验。
50.图3示出本公开另一实施例的语音播报方法的流程示意图。如图3所示,该语音播报方法可以包括如下步骤。
51.s201,获取需要播报的语音播报内容,定义每条语音播报内容的优先级参数信息。
52.作为示例,该优先级参数信息例如包括音量、音速、是否要有提示音等。
53.s202,对接收到语音播报内容,对每条语音播报内容的优先级参数信进行分类。
54.作为示例,音量调节、音速调节等可以归类为语音特征参数信息类。
55.s203,按照每个分类对应的播报参数,依次调节每个分类中每条语音播报内容的播报参数。
56.s204,根据设置好的播报参数,播报该语音播报内容。
57.根据本公开实施例的语音播报方法,可以根据语音播报内容的优先级参数信息修改播报的相关参数,及时地警示用户做出响应,避免用户错过一些重要的语音播报信息。
58.图4示出本公开实施例提供的一种语音播报装置的组成框图。如图4所示,该语音播报装置包括如下模块。
59.参数确定模块310,用于确定语音播报指令中每条语音播报内容的优先级参数信息。
60.参数调整模块320,用于据优先级参数信息,调整每条语音播报内容的播报参数,得到每条语音播报内容的调整后的播报参数。
61.内容播报模块330,用于按照调整后的播报参数,播报每条语音播报内容。
62.在一个实施例中,语音播报装置还包括:指令接收模块,用于接收语音播报指令,其中,语音播报指令中包含至少一条语音播报内容。
63.在一个实施例中,参数确定模块310具体还用于从每条语音播报内容中提取特定
重要信息;对包含特定重要信息的语音播报内容,设置与特定重要性信息对应的优先级参数信息。
64.在一个实施例中,特定重要信息包括:特定路况信息、特定路口信息、特定天气信息和/或特定日程信息等。
65.在一个实施例中,参数调整模块320具体可以包括:参数分类单元,用于对优先级参数信息进行分类,得到优先级参数信息的类别;参数调整模块320具体还用于按照类别,分别调整每个类别中所包含的每条语音播报内容的播报参数。
66.在一个实施例中,优先级参数信息的类别包括:语音特征参数信息和提示音特征参数信息中的至少一种。
67.在一个实施例中,语音特征参数信息包括:音速、音量、音调、音高、音色和响度中的至少一种;和/或,提示音特征参数信息包括:提示音内容、提示音时长和提示音重复次数中的至少一种。
68.根据本公开实施例的语音播报装置,可以对语音播报指令中的每一条语音播报内容设置优先级参数信息,并根据设置的优先级参数信息调节每条语音播报内容的播报参数,突出不同的语音播报内容,并提高用户体验。
69.需要明确的是,本发明并不局限于上文实施例中所描述并在图中示出的特定配置和处理。为了描述的方便和简洁,这里省略了对已知方法的详细描述,并且上述描述的系统、模块和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
70.图5是示出本公开实施例的一种语音播报系统的结构示意图。如图5所示,该语音处理系统可以包括如下模块。
71.指令接收装置410,用于接收语音播报指令,语音播报指令中包括至少一条语音播报内容;语音播报装置420,用于根据接收的语音播报指令,执行上述实施例中的任一种语音播报方法。
72.通过上述实施例的描述可知,该语音播报内容可以是任何以语音播报的形式输出的内容。例如:语音导航系统所产生的导航信息对应的播报内容、人工智能交互系统产生的交互信息对应的播报内容、或者其他纯语音应用中的播报内容等,再次不再赘述。
73.为了描述的方便和简洁,这里省略了对已知方法的详细描述,并且上述描述的系统、模块和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
74.图6示出本公开实施例提供的一种语音播报设备的组成框图;如图6所示,本公开实施例提供一种语音播报设备,包括:一个或多个处理器501;存储器502,其上存储有一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现上述任意一项的语音播报方法;一个或多个i/o接口503,连接在处理器与存储器之间,配置为实现处理器与存储器的信息交互。
75.其中,处理器501为具有数据处理能力的器件,其包括但不限于中央处理器(cpu)等;存储器502为具有数据存储能力的器件,其包括但不限于随机存取存储器(ram,更具体如sdram、ddr等)、只读存储器(rom)、带电可擦可编程只读存储器(eeprom)、闪存(flash);i/o接口(读写接口)503连接在处理器501与存储器502间,能实现处理器501与存储器502的信息交互,其包括但不限于数据总线(bus)等。
76.在一些实施例中,处理器501、存储器502和i/o接口503通过总线504相互连接,进
而与语音播报设备的其他组件连接。
77.图7示出本公开实施例提供的一种计算机可读介质的组成框图。如图7所示,本公开实施例提供一种计算机可读介质,其上存储有计算机程序,程序被处理器执行时实现上述任意一种语音播报方法。
78.本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、系统、装置中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。在硬件实施方式中,在以上描述中提及的功能模块/单元之间的划分不一定对应于物理组件的划分;例如,一个物理组件可以具有多个功能,或者一个功能或步骤可以由若干物理组件合作执行。某些物理组件或所有物理组件可以被实施为由处理器,如中央处理器、数字信号处理器或微处理器执行的软件,或者被实施为硬件,或者被实施为集成电路,如专用集成电路。这样的软件可以分布在计算机可读介质上,计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的,术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其它数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于ram、rom、eeprom、闪存或其它存储器技术、cd-rom、数字多功能盘(dvd)或其它光盘存储、磁盒、磁带、磁盘存储或其它磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其它的介质。此外,本领域普通技术人员公知的是,通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其它传输机制之类的调制数据信号中的其它数据,并且可包括任何信息递送介质。
79.本文已经公开了示例实施例,并且虽然采用了具体术语,但它们仅用于并仅应当被解释为一般说明性含义,并且不用于限制的目的。在一些实例中,对本领域技术人员显而易见的是,除非另外明确指出,否则可单独使用与特定实施例相结合描述的特征、特性和/或元素,或可与其它实施例相结合描述的特征、特性和/或元件组合使用。因此,本领域技术人员将理解,在不脱离由所附的权利要求阐明的本公开的范围的情况下,可进行各种形式和细节上的改变。