← 返回列表

一种基于自然语言处理和机器学习的文字校对方法与系统

申请号: CN202311777261.X
申请人: 创云融达信息技术(天津)股份有限公司
更新日期: 2026-03-09

摘要文本

创云融达信息技术(天津)股份有限公司取得“一种透气窗帘布”专利技术,更多数据:搜索专利查询网来源: 本发明公开了一种基于自然语言处理和机器学习的文字校对方法与系统,涉及文字校对技术领域,包括如下步骤:在机器学习模块中,通过使用机器学习算法,对大量的语言数据和校对样本进行训练和学习,在语言处理模块中,方法对输入的文本进行预处理和分析,在错误检测模块中,基于RNN和长短时记忆网络LSTM的语言模型对文本中的错误进行检测和标记,通过上下文感知模块识别和维护上下文信息,进行语义校正,通过个性化校对模块对文本进行个性化的校对和优化,通过校对建议模块为用户提供实时的校对建议,通过更新模块保持系统的最新状态。本发明能够在文本校对过程中实现更准确、高效的纠错和优化,为用户提供高质量的文本校对服务。

专利主权项内容

1.一种基于自然语言处理和机器学习的文字校对方法,其特征在于,包括以下步骤:建立基于机器学习算法的循环神经网络模型;将分词后的待校对文本输入所述循环神经网络模型中,对所述待校对文本进行词法分析、句法分析和语义分析,获得所述待校对文本的结构;利用自然语言处理技术,对所述待校对文本结构中的拼写、语法和语义进行检测,检测到各类错误;通过分析待校对文本的上下文关系,对检测到的各类所述错误进行判断和修正;通过分析目标用户的历史校对和反馈,学习用户的偏好,对特定领域术语和习惯用语进行防错误识别处理;根据所述错误的判断和修正结果,以及经过防错误识别处理的特定领域术语和习惯用语生成校对建议。

专利申请信息

项目 内容
专利名称 一种基于自然语言处理和机器学习的文字校对方法与系统
专利类型 发明申请
申请号 CN202311777261.X
申请日 2023/12/22
公告号 CN117454906A
公开日 2024/1/26
IPC主分类号 G06F40/30
权利人 创云融达信息技术(天津)股份有限公司
发明人 张颖; 曹以然
地址 天津市滨海新区经济技术开发区滨海-中关村科技园融汇商务园5区1号楼三层-29号