一种字符串纠错方法和装置
申请人信息
- 申请人:北京搜狗科技发展有限公司
- 申请人地址:100084 北京市海淀区中关村东路1号院9号楼搜狐网络大厦9层01房间
- 发明人: 北京搜狗科技发展有限公司
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种字符串纠错方法和装置 |
| 专利类型 | 发明授权 |
| 申请号 | CN201810759149.6 |
| 申请日 | 2018年7月11日 |
| 公告号 | CN110780749B |
| 公开日 | 2024年3月8日 |
| IPC主分类号 | G06F3/023 |
| 权利人 | 北京搜狗科技发展有限公司 |
| 发明人 | 费腾; 崔欣; 张扬 |
| 地址 | 北京市海淀区中关村东路1号院9号楼搜狐网络大厦9层01房间 |
摘要文本
北京搜狗科技发展有限公司取得“一种透气窗帘布”专利技术,本申请实施例公开了一种字符串纠错方法和装置,确定用户上屏的上屏词组,该上屏词组中可以包括用户依次上屏的多个上屏词,将该上屏词组输入到深度学习模型中,可以得到结果向量,该结果向量可以标识在上屏词组后出现不同词的概率。当基于所述上屏词组之后输入的目标字符串需要纠错时,可以根据该目标字符串得到多个待定纠错结果。由于由最近上屏的上屏词所构成的上屏词组能够在语义上较为准确的体现出用户当前的实际输入需求,故根据结果向量所标识的不同词以及不同词对应的概率,可以从该多个待定纠错结果中确定出该目标字符串相对于上屏词组应有的纠错结果,该纠错结果符合用户实际输入需求的可能性更大,提高了用户的输入体验。
专利主权项内容
1.一种字符串纠错方法,其特征在于,所述方法包括:确定上屏词组,所述上屏词组包括用户依次上屏的至少一个上屏词;将所述上屏词组输入到深度学习模型中得到结果向量,所述结果向量用于标识在所述上屏词组后出现不同词的概率;对基于所述上屏词组之后输入的目标字符串进行纠错,得到多个待定纠错结果;根据所述结果向量从所述多个待定纠错结果中确定出所述目标字符串对应的纠错结果,具体包括:根据所述结果向量确定出概率高于预定阈值的至少一个词;确定所述至少一个词分别对应的字符串;基于所述至少一个词分别对应的字符串和所述至少一个词由所述结果向量所标识的概率建立对应关系列表;通过查找所述对应关系列表,将所述多个待定纠错结果中与所述字符串相同的待定纠错结果确定为所述目标字符串对应的纠错结果;或者,建立所述结果向量所标识不同词的词标识与不同词的概率间的对应关系;根据所述结果向量所标识不同词对应的字符串建立字符串查询树,所述字符串查询树中的字符串具有所对应词的词标识;根据所述多个待定纠错结果查询所述字符串查询树;若所述多个待定纠错结果中的目标待定纠错结果得到查询结果,根据所述查询结果中的词标识和所述对应关系确定出所述目标待定纠错结果对应的概率;若所述目标待定纠错结果对应的概率满足预设条件,将所述目标待定纠错结果确定为所述目标字符串对应的纠错结果。