← 返回列表
端到端语音唤醒方法、装置及计算机设备
申请人信息
- 申请人:北京搜狗科技发展有限公司
- 申请人地址:100084 北京市海淀区中关村东路1号院9号楼搜狐网络大厦9层01房间
- 发明人: 北京搜狗科技发展有限公司
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 端到端语音唤醒方法、装置及计算机设备 |
| 专利类型 | 发明授权 |
| 申请号 | CN201810763704.2 |
| 申请日 | 2018年7月12日 |
| 公告号 | CN110782898B |
| 公开日 | 2024年1月9日 |
| IPC主分类号 | G10L15/26 |
| 权利人 | 北京搜狗科技发展有限公司 |
| 发明人 | 姚光超 |
| 地址 | 北京市海淀区中关村东路1号院9号楼搜狐网络大厦9层01房间 |
摘要文本
北京搜狗科技发展有限公司取得“一种透气窗帘布”专利技术,本发明公开了一种端到端语音唤醒方法、装置及计算机设备,该方法包括:接收待检测语音;依次提取每个语音帧的声学特征;将提取的声学特征输入声学模型,得到所述声学模型输出的每个语音帧中各目标发音单元的概率;逐帧计算各目标发音单元的累积概率,并确定各目标发音单元的起始位置和结束位置;根据所述累积概率及起始位置和结束位置计算各目标发音单元的长度及平均概率;根据各目标发音单元的长度和/或平均概率进行唤醒操作。利用本发明,可以降低误唤醒率,提高唤醒效果。。来源:百度搜索专利查询网
专利主权项内容
1.一种端到端语音唤醒方法,其特征在于,所述方法包括:接收待检测语音;依次提取每个语音帧的声学特征;将提取的声学特征输入声学模型,得到所述声学模型输出的每个语音帧中各目标发音单元的概率;逐帧计算各目标发音单元的累积概率,并确定各目标发音单元的起始位置和结束位置;根据所述累积概率及起始位置和结束位置计算各目标发音单元的长度及平均概率;根据各目标发音单元的长度和/或平均概率进行唤醒操作;其中,所述逐帧计算各目标发音单元的累积概率包括:对于每个目标发音单元,将上一帧该目标发音单元的累积概率和当前帧前一目标发音单元的累积概率这两者中的最大值,加上当前帧该目标发音单元的概率,作为当前帧该目标发音单元的累积概率;所述根据所述累积概率及起始位置和结束位置计算各目标发音单元的长度及平均概率包括:将所述目标发音单元的结束位置与起始位置相减得到所述目标发音单元的长度;将对应所述结束位置的累积概率与对应所述起始位置的累积概率相减,然后除以所述目标发音单元的长度,得到所述目标发音单元的平均概率。