← 返回列表

多命令词的语音解码识别方法、装置、设备及存储介质

申请号: CN202410156317.8
申请人: 深圳市友杰智新科技有限公司
更新日期: 2026-03-17

专利详细信息

项目 内容
专利名称 多命令词的语音解码识别方法、装置、设备及存储介质
专利类型 发明申请
申请号 CN202410156317.8
申请日 2024/2/4
公告号 CN117690434A
公开日 2024/3/12
IPC主分类号 G10L15/22
权利人 深圳市友杰智新科技有限公司
发明人 李杰
地址 广东省深圳市南山区招商街道沿山社区沿山路22号火炬大厦701

摘要文本

本申请涉及语音解码技术领域,特别是涉及到一种多命令词的语音解码识别方法、装置、设备及存储介质,其中方法包括:基于转换为token序列的所述命令词列表生成前缀树;基于用户指令的语音识别模型输出,结合前缀树在模型输出中计算当前时间步对应的指定数量的候选序列;识别所述候选序列的前缀序列在所述前缀树中确认当前时间步对应的节点,并基于所述节点的子节点,确定下一个时间步的token搜索范围;对所述token搜索范围进行目标搜索,并根据搜索结果更新扩展所述前缀序列;直到最后一个时间步搜索完毕后,对获得的预选数量的所述候选序列进行二次打分,得到识别结果。本申请解码时长受命令词数量变化影响小,确保了系统处理大量命令词时保持高效性。 (来 自 专利查询网)

专利主权项内容

1.一种多命令词的语音解码识别方法,其特征在于,所述方法包括:将命令词列表中的命令词转换为token序列;基于转换为token序列的所述命令词列表,生成前缀树;基于用户指令的语音识别模型输出,结合所述前缀树在模型输出中计算当前时间步对应的指定数量的候选序列;识别所述候选序列的前缀序列在所述前缀树中确认当前时间步对应的节点,并基于所述节点的子节点,确定下一个时间步的token搜索范围;对所述token搜索范围进行目标搜索,并根据搜索结果更新扩展所述前缀序列;直到最后一个时间步搜索完毕后,对获得的预选数量的所述候选序列进行二次打分,得到识别结果。