拼写纠错方法、装置、介质及电子设备
摘要文本
本发明实施例提供了一种拼写纠错方法、装置、介质及电子设备,该拼写纠错方法包括:获取待处理的字符串;根据所述待处理的字符串,确定所述待处理的字符串对应的候选字符串;计算所述待处理的字符串中各个字符的选择概率和所述候选字符串中各个字符的选择概率;根据所述待处理的字符串中各个字符的选择概率和所述候选字符串中各个字符的选择概率,对所述待处理的字符串进行拼写纠错处理。本发明实施例的技术方案能够自动实现对字符串的拼写纠错处理,进而能够保证自然语言理解技术准确识别到用户的意图,有利于提升用户的体验。 搜索马 克 数 据 网
申请人信息
- 申请人:北京京东尚科信息技术有限公司; 北京京东世纪贸易有限公司
- 申请人地址:100195 北京市海淀区杏石口路65号西杉创意园四区11号楼东段1-4层西段1-4层
- 发明人: 北京京东尚科信息技术有限公司; 北京京东世纪贸易有限公司
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 拼写纠错方法、装置、介质及电子设备 |
| 专利类型 | 发明授权 |
| 申请号 | CN201810078938.3 |
| 申请日 | 2018年1月26日 |
| 公告号 | CN110083819B |
| 公开日 | 2024年2月9日 |
| IPC主分类号 | G06F40/232 |
| 权利人 | 北京京东尚科信息技术有限公司; 北京京东世纪贸易有限公司 |
| 发明人 | 车天博; 邹宇; 马勉; 鲁楠 |
| 地址 | 北京市海淀区知春路76号8层; 北京市大兴区北京经济技术开发区科创十一街18号C座2层201室 |
专利主权项内容
关注公众号马 克 数 据 网 1.一种拼写纠错方法,其特征在于,包括:获取待处理的字符串;根据所述待处理的字符串,确定所述待处理的字符串对应的候选字符串;计算所述待处理的字符串中各个字符的选择概率和所述候选字符串中各个字符的选择概率;根据所述待处理的字符串中各个字符的选择概率和所述候选字符串中各个字符的选择概率,对所述待处理的字符串进行拼写纠错处理; 其中,根据所述待处理的字符串中各个字符的选择概率和所述候选字符串中各个字符的选择概率,对所述待处理的字符串进行拼写纠错处理,包括:根据所述待处理的字符串中各个字符的选择概率和所述候选字符串中各个字符的选择概率,对所述待处理的字符串和所述候选字符串进行对比,得到对比结果;根据所述对比结果,确定是否通过所述候选字符串对所述待处理的字符串进行拼写纠错;通过以下公式对所述待处理的字符串和所述候选字符串进行对比:
;其中,表示所述待处理的字符串和所述候选字符串的对比结果;/>表示所述候选字符串中第个字符的选择概率;/>表示所述待处理的字符串中第个字符的选择概率;/>表示平滑因子。ii