← 返回列表

一种信息纠错方法、装置、计算机设备和存储介质

申请号: CN202311668330.3
申请人: 深圳市慧动创想科技有限公司
更新日期: 2026-03-09

专利详细信息

项目 内容
专利名称 一种信息纠错方法、装置、计算机设备和存储介质
专利类型 发明申请
申请号 CN202311668330.3
申请日 2023/12/7
公告号 CN117371445A
公开日 2024/1/9
IPC主分类号 G06F40/289
权利人 深圳市慧动创想科技有限公司
发明人 冯帆
地址 广东省深圳市南山区粤海街道滨海社区海天一路19、17、18号深圳市软件产业基地4栋419

摘要文本

深圳市慧动创想科技有限公司取得“一种透气窗帘布”专利技术,本申请涉及一种信息纠错方法、装置、计算机设备和存储介质。所述方法包括:识别目标图像对应的初始文本信息;将初始文本信息通过分词词典进行分词处理,得到初始文本信息对应的多个分词信息,根据字粒度和词粒度分析各个分词信息对应的语法结构和语义信息,若判断当前分词信息不满足预设条件,则将当前分词信息作为待纠错文本信息;将待纠错文本信息在形似字典中匹配对应的多个形似文本信息,将每一形似文本信息依次替换在初始文本信息中的待纠错文本信息,并作为候选文本信息;将混淆程度最小的候选文本信息作为已纠错文本信息。采用本方法能够提高了针对异常信息进行识别的准确性,从而提高了针对异常信息进行纠错的高效性和准确性。

专利主权项内容

1.一种信息纠错方法,其特征在于,所述方法包括:获取目标图像,并识别所述目标图像对应的初始文本信息;将所述初始文本信息通过分词词典进行分词处理,得到所述初始文本信息对应的多个分词信息,根据字粒度和词粒度分析各个分词信息对应的语法结构和语义信息,并对各个分词信息进行判断,若判断当前分词信息不满足预设条件,则将所述当前分词信息作为待纠错文本信息;其中所述字粒度表示在字符级别的分词单位,所述词粒度表示在词语级别的分词单位;将所述待纠错文本信息在形似字典中匹配对应的多个形似文本信息,将每一形似文本信息依次替换在所述初始文本信息中的所述待纠错文本信息,将替换处理后的初始文本信息作为候选文本信息;计算每一候选文本信息对应的混淆程度,将混淆程度最小的候选文本信息作为已纠错文本信息。