首页 > 乐器声学 专利正文
音频输入装置、防监听易输入设备及语音输入方法与流程

时间:2022-02-24 阅读: 作者:专利查询

音频输入装置、防监听易输入设备及语音输入方法与流程

1.本发明涉及音频输入技术领域,尤其涉及一种音频输入装置、防监听易输入设备及语音输入方法。


背景技术:

2.随着人工智能与语音识别的技术发展,语音输入法已渐渐普及。语音输入是根据操作者的讲话,智能终端识别成对应语言的输入方法(又称声控输入),一般还能够通过与智能终端相连的话筒读出输入的语音。现有语音输入法主要使用智能终端已经集成或接入的标准音频设备,并与其他软件共享使用该音频设备,由此带来诸多问题。
3.典型的问题主要包括以下几个方面:(1)泄密风险:多数音频输入设备的工作状态不可见,恶意软件可以打开该音频设备进行非法监听导致泄密,部分用户可能忘记关闭麦克风或软件导致泄密了,影响了用户的使用安全;(2)共享冲突:由于涉及语音的应用越来越多,多个应用同时开启会造成冲突,如在进行语音会议时同时通过语音输入法进行文字输入将会带来冲突;(3)使用不方便:在用户需要进行语音输入的时候,需要对语音输入功能进行启动或停止,通常要将输入焦点放到输入区,而启动或停止输入功能往往是另一个窗口,容易丢失输入焦点,同时造成视觉的不便或不适,如识别出的文字不准确需要更正时,往往要使用其他输入法,这时切换或启动及停止语音输入较为麻烦。
4.在实现本发明过程中,发明人发现现有技术中至少存在如下问题:
5.现有语音输入方法及相应设备容易给用户带来安全隐患,用户的使用体验较差。


技术实现要素:

6.本发明的目的在于提供一种音频输入装置、防监听易输入设备及语音输入方法,以解决现有技术中存在的语音输入方法及相应设备容易给用户带来安全隐患,用户的使用体验较差的技术问题。本发明提供的诸多技术方案中的优选技术方案所能产生的诸多技术效果详见下文阐述。
7.为实现上述目的,本发明提供了以下技术方案:
8.本发明提供的一种音频输入装置,用于向智能终端进行语音输入,包括采集模块、控制模块和指示灯,所述采集模块用于采集音频信号,所述控制模块对所述音频信号进行识别和处理,所述指示灯能够显示所述音频输入装置的不同状态,其特征在于,还包括振动检测模块;所述振动检测模块与所述控制模块电连接;所述振动检测模块能够通过移动或触碰产生触发信号;所述控制模块能够对所述触发信号进行识别和处理,开启或关闭所述采集模块,以及控制所述指示灯的显示状态。
9.优选的,所述音频输入装置采用与所述智能终端通过usb接口连接,并采用hid设备中的自定义数据协议进行通讯,所述自定义数据协议不能直接兼容windows、mac os、linux、ios或android操作系统。
10.优选的,所述音频输入装置只能被所述智能终端的一个所述语音输入法应用独占
使用;所述语音输入法启动后持续占用所述音频输入装置,所述智能终端的其他应用不能再调用所述音频输入装置。
11.优选的,所述音频输入装置不能通过所述智能终端的程序或进程进行开启或关闭。
12.一种防监听易输入设备,所述防监听易输入设备包括以上任一所述的音频输入装置,还包括按键或操控模块,所述按键或操控模块与所述指示灯、控制模块电连接,并能够开启或关闭对应的所述音频输入装置,使所述防监听易输入设备进入工作状态或待机状态。
13.优选的,所述音频输入装置通电后的默认状态为所述待机状态,所述音频输入装置与所述语音输入法应用未建立通讯连接前也一直处于所述待机状态;所述音频输入装置处于所述待机状态时,所述音频输入装置向所述智能终端发送心跳数据包,表明所述音频输入装置已经上电并能通讯且处于所述待机状态。
14.优选的,所述音频输入装置与所述语音输入法应用建立通讯连接后,通过所述按键或操控模块开启所述音频输入装置,所述音频输入装置由所述待机状态切换为所述工作状态;所述音频输入装置处于工作状态时,根据语音检测信号向智能终端发送音频数据包;通过所述按键或操控模块关闭所述音频输入装置后,所述音频输入装置由所述工作状态切换为所述待机状态。
15.优选的,在所述音频输入装置处于所述工作状态时,当所述采集模块采集的音频信号达到设定门限和/或设定时延后,所述音频输入装置由所述工作状态切换为所述待机状态。
16.一种语音输入方法,所述语音输入方法采用以上任一所述的音频输入装置或以上任一所述的防监听易输入设备进行语音输入,所述语音输入方法包括以下步骤:
17.s100:所述语音输入方法程序启动并初始化;
18.s200:所述智能终端与所述音频输入装置建立通讯连接,并判断所述通讯连接是否成功建立,如失败则重复执行步骤s200;如成功则执行步骤 s300;
19.s300:读取所述音频输入装置发送的数据包;如果超过设定时间未收到所述音频输入装置发送的数据包,返回步骤s200;
20.s400:判断所述音频输入装置发送的数据包是否为音频信号;如不是音频信号返回步骤s300,如是音频信号则执行步骤s500;
21.s500:通过语音识别算法将所述音频信号转换为对应文字或字符,并按所述智能终端系统的语音输入法要求的协议数据格式发送对应输入信息;同时返回步骤s300,进行下一次语音输入。
22.实施本发明上述技术方案中的一个技术方案,具有如下优点或有益效果:
23.本发明的音频输入装置通过移动或触碰进行开启或关闭,即通过对硬件的操作实现开启或关闭,而不是现有语音输入法由软件进行启动,由此大大降低了语音输入过程中可能产生的潜在风险,同时指示灯能够通过颜色变化等显示状态实现对用户工作状态的提醒,避免用户在不知情的情况下音频输入装置开启进行工作,进一步降低了安全隐患,用户的使用体验更好。
附图说明
24.为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单的介绍,显而易见,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图,附图中:
25.图1是本发明实施例的原理框图;
26.图2是本发明语音输入方法实施例的流程图。
具体实施方式
27.为了使本发明的目的、技术方案及优点更加清楚明白,下文将要描述的各种示例性实施例将要参考相应的附图,这些附图构成了示例性实施例的一部分,其中描述了实现本发明可能采用的各种示例性实施例。除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。应明白,它们仅是与如所附权利要求书中所详述的、本发明公开的一些方面相一致的流程、方法和装置等的例子,还可使用其他的实施例,或者对本文列举的实施例进行结构和功能上的修改,而不会脱离本发明的范围和实质。
28.在本发明的描述中,需要理解的是,术语“中心”、“纵向”、“横向”等指示的是基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的元件必须具有的特定的方位、以特定的方位构造和操作。术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。术语“多个”的含义是两个或两个以上。术语“相连”、“连接”应做广义理解,例如,可以是固定连接、可拆卸连接、一体连接、机械连接、电连接、通信连接、直接相连、通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系。术语“和/或”包括一个或多个相关的所列项目的任意的和所有的组合。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
29.为了说明本发明所述的技术方案,下面通过具体实施例来进行说明,仅示出了与本发明实施例相关的部分。
30.实施例一:
31.如图1所示,本发明提供了一种音频输入装置,用于向智能终端进行语音输入,智能终端为需要进行人机交互,并能够对输入信息进行识别处理的设备,一般还通过屏幕对输入信息进行显示,以实现准确的信息输入,如手机、台式pc、桌面一体机、平板电脑、笔记本、各行业智能设备等。包括采集模块、控制模块和指示灯,采集模块用于采集音频信号,如现有的麦克风设备,控制模块对音频信号进行识别和处理,控制模块主要由相应的控制芯片组成,控制芯片为现有技术,实现对音频信号的门限设定以降低噪音干扰,对音频信号进行ad转换,便于智能终端处理。指示灯用于对音频输入装置的工作状态进行显示,如通过灯的不同颜色区分不同的状态,如红色表示工作状态、绿色表示待机状态、黄色表示故障等,以实现对用户的提醒。当然,音频输入装置还可包括通讯模块,通讯模块可以采用有线或无线传输方式,采用现有的通信协议即可,实现音频输入装置与智能终端之间的信息传输,将音频信号发送至智能终端。音频输入装置还包括振动检测模块;振动检测模块与控制模块
电连接,从而实现与控制模块之间的信号传输。振动检测模块能够通过移动或触碰产生触发信号,振动检测模块优选由陀螺仪传感器和压力传感器组成。振动检测模块在受到外力移动时,陀螺仪传感器的旋转轴也会发生相应改变,从而产生相应的电信号,陀螺仪传感器的灵敏度(即门限)根据需要设定,以不产生错误信号为宜(如振动检测模块在没有触碰时也产生触发信号,或触碰时不能产生触发信号)。用户触碰振动检测模块时,会对振动检测模块产生一个相应压力,压力传感器通过压力敏感元件将该压力信号转换为相应电信号,触碰产生的压力值范围(即门限)根据需要进行设定,以不产生错误信号为宜(如振动检测模块在没有触碰时也产生触发信号,或触碰时不能产生触发信号)。控制模块收到振动检测模块发出的相应信号后,控制模块能够对触发信号进行识别和处理,并控制开启或关闭采集模块,以及控制指示灯的显示状态。开启、关闭通过设置振动检测模块不同的门限来实现,如触碰的压力、移动的幅度不同,如大幅度移动、大压力触碰为关闭 (由于关闭操作使用相对少一些,大幅度移动、大压力触碰更为合适),小幅度移动、小压力触碰为开启,具体值的范围根据需要进行设定。控制指示灯的显示状态用于实现对用户的提醒,表明音频输入装置当前的状态。当然,音频输入装置可以设置相应的开关,开关优选通过开关二极管实现,以便于控制模块对采集模块、指示灯的更好控制,实现对振动检测模块触发信号的快速响应。本发明的音频输入装置通过移动或触碰进行开启或关闭,即通过对硬件的操作实现开启或关闭,而不是现有语音输入法由软件进行启动,由此大大降低了语音输入过程中可能产生的潜在风险,同时指示灯能够通过颜色变化等显示状态实现对用户工作状态的提醒,避免用户在不知情的情况下音频输入装置开启进行工作,进一步降低了安全隐患,用户的使用体验更好。
32.作为可选的实施方式,音频输入装置与智能终端通过usb接口连接, usb接口较为常见,一般智能设备均有配置,usb接口采用的协议较为通用,便于进行信息传输,音频输入与智能终端通过usb接口连接可以提高产品的适用性。音频输入装置采用hid设备中的自定义数据协议进行通讯,即音频输入装置为usb

hid(universal serial bus

human interface device) 设备,便于进行人机交互。自定义数据协议便于对帧头、地址信息、数据类型、数据长度、数据块、校验码、帧尾等信息进行个性化设置,提高产的适用性。通过自定义数据协议进行通讯可以避免操作系统直接识别该音频输入装置,从而可以自动对其开启或关闭,降低了安全隐患。自定义数据协议不能直接兼容windows、mac os、linux、ios或android操作系统,即音频输入装置不是现有windows、mac os、linux、ios、android操作系统的即插即用的音频输入设备。音频输入装置对音频信号采集处理后,通过定义数据协议发送给智能终端,从而避免操作系统或相应的应用软件对音频输入装置进行直接控制,产生相应的安全风险。
33.作为可选的实施方式,音频输入装置只能被智能终端的一个语音输入法应用独占使用,即只能由本发明对应的语音输入法开启时使用,智能终端的其他应用不能再调用所述音频输入装置,避免了恶意软件等控制使用本音频输入装置,带来安全隐患。语音输入法启动后持续占用所述音频输入装置,即语音输入法启动后,音频输入装置一直处于待机状态,便于用户随时开启使用进入语音输入,提高了用户体验的舒适性。
34.作为可选的实施方式,音频输入装置不能通过智能终端的程序或进程进行开启或关闭。语音输入时,不需要通过软件对窗口界面进行开启或关闭操作,通过移动或触碰操作
控制,极大方便了用户,也便于用户实现更直接控制。同时,通过音频输入装置自身进行控制,避免了智能终端上的软件在用户不察觉的时候对音频输入装置进行控制,采集用户的音频信息,降低了风险。
35.实施例仅是一个特例,并不表明本发明就这样一种实现方式。
36.实施例二:
37.一种防监听易输入设备,如图1所示,防监听易输入设备包括本发明提供的音频输入装置,音频输入装置可以集成在防监听易输入设备的内部,也可以插在防监听输入设备的接口上使用,从而防监听输入设备也具有实施例一中提高的优点,防监听输入设备既可以是实施例一提到的智能终端,也可为另外添加的单独设备。防监听易输入设备还包括按键或操控模块,按键或操控模块可与防监听易输入设备通过现有接口连接,尤其适合音频输入装置集成在防监听易输入设备的内部,不易进行触碰或移动时。按键或操控模块与控制模块电连接。按键或操控模块便于用户操作,提升了使用体验,按键或操控模块能够开启或关闭对应的音频输入装置,使防监听易输入设备进入工作状态或待机状态。即只通过硬件的方式对音频输入装置开启或关闭,避免了防监听易输入设备通过软件进行控制,能够有效防止恶意软件自动开启音频输入装置,对用户的输入内容进行监听,同时用户的输入操作也更为方便。
38.作为可选的实施方式,音频输入装置通电后的默认状态为待机状态,音频输入装置与语音输入法应用未建立通讯连接前也一直处于待机状态。待机状态指音频输入装置还不能进行音频输入,即通电后音频输入装置并不会自动开启,避免用户误操作时音频输入装置即开启进入工作状态。音频输入装置处于待机状态时,音频输入装置向智能终端发送心跳数据包。心跳包是音频输入装置向智能终端间定时通知自己状态的一个自己定义的命令字,按照一定的时间间隔发送,具体的命令字、时间间隔可根据用户需要进行设定,发送心跳数据包表明音频输入装置已经上电并能通讯且处于待机状态,便于智能终端随时启用音频输入装置。
39.作为可选的实施方式,音频输入装置与语音输入法应用建立通讯连接后,通过按键或操控模块开启音频输入装置,音频输入装置由待机状态切换为工作状态,在工作状态时,音频输入装置能够进行音频输入,并对音频信号进行处理,发送至防监听输入设备,从而实现用户的语音输入。音频输入装置处于工作状态时,根据语音检测信号向智能终端发送音频数据包,实现语音输入;通过按键或操控模块关闭音频输入装置后,音频输入装置由工作状态切换为待机状态,不能再对音频识别。通过按键或操控模块对音频输入装置进行开启和关闭便于用户使用,提升了使用体验。
40.作为可选的实施方式,在音频输入装置处于工作状态时,当采集模块采集的音频信号达到设定门限(即用户不再讲话时,具体的门限值可根据不同的使用环境进行设定)和/或设定时延(具体时间根据需要设定,如1 分钟、2分钟、5分钟等)后,两种方式既可以单独使用,也可以配合在一起使用,从而更好对用户的使用状态进行管理,这两种情况也表明了用户没有继续使用音频输入装置,当用户不再使用音频输入装置时,音频输入装置由工作状态切换为待机状态,一方面能够避免对用户不需要输入时进行输入,另一方面也提升了安全性。
41.实施例三:
42.一种语音输入方法,采用本发明提供的音频输入装置或防监听易输入设备进行语音输入,如图2所示,该语音输入方法包括以下步骤:
43.s100:语音输入方法程序启动并初始化,为用户向音频输入装置或防监听易输入设备进行语音输入做好准备;
44.s200:智能终端与音频输入装置建立通讯连接,建立通讯连接才能进行语音输入,并判断通讯连接是否成功建立,具体的判断方法可采用现有技术,如失败则重复执行步骤s200,直至两者之间的通讯连接成功建立;如成功则执行步骤s300;
45.s300:读取音频输入装置发送的数据包,数据包中即为用户的语音输入信息;如果超过设定时间未收到音频输入装置发送的数据包,具体时间可根据实际需要进行设定,返回步骤s200;
46.s400:判断音频输入装置发送的数据包是否为音频信号,可通过分析音频信号的时间特性和频率特性判断数据包是否为音频信号;如不是音频信号返回步骤s300,继续读取音频输入装置发送的数据包,如是音频信号则执行步骤s500;
47.s500:通过语音识别算法将音频信号转换为对应文字或字符,具体的语音识别算法为现有算法,并按智能终端系统的语音输入法要求的协议数据格式(即hid设备中的自定义数据协议中定义的数据格式)发送对应输入信息;同时返回步骤s300,进行下一次语音输入。
48.以上所述仅为本发明的较佳实施例而已,本领域技术人员知悉,在不脱离本发明的精神和范围的情况下,可以对这些特征和实施例进行各种改变或等同替换。另外,在本发明的教导下,可以对这些特征和实施例进行修改以适应具体的情况及材料而不会脱离本发明的精神和范围。因此,本发明不受此处所公开的具体实施例的限制,所有落入本技术的权利要求范围内的实施例都属于本发明的保护范围。