← 返回列表

文本缺陷检测方法、装置、设备和存储介质

申请号: CN202311318926.0
申请人: 西安栗子互娱网络科技有限公司
申请日期: 2023/10/11

摘要文本

本发明提供了文本缺陷检测方法、装置、设备和存储介质,属于缺陷检测技术领域,其方法包括:获取原始文本数据,并对所述原始文本数据进行预处理;对预处理后的原始文本数据进行词法分析和实体识别,获取文本数据的特征,并提取文本数据中的属性信息;基于所述文本数据的特征及属性信息训练神经网络模型,并对训练后的神经网络模型进行模型评估;基于评估后的模型对目标文本数据进行文本缺陷检测,并将检测结果进行反馈。解决了背景技术中在大量文本数据中,识别文本中拼写错误、语法错误、用词不当的问题。

专利详细信息

项目 内容
专利名称 文本缺陷检测方法、装置、设备和存储介质
专利类型 发明申请
申请号 CN202311318926.0
申请日 2023/10/11
公告号 CN117350283A
公开日 2024/1/5
IPC主分类号 G06F40/284
权利人 西安栗子互娱网络科技有限公司
发明人 邓淳; 罗林; 邓紫涵
地址 陕西省西安市高新区细柳街办天谷七路88号新加坡腾飞科汇城B幢西楼0602室

专利主权项内容

1.一种文本缺陷检测方法,其特征在于,该方法包括:步骤1:获取原始文本数据,并对所述原始文本数据进行预处理;步骤2:对预处理后的原始文本数据进行词法分析和实体识别,获取文本数据的特征,并提取文本数据中的属性信息;步骤3:基于所述文本数据的特征及属性信息训练神经网络模型,并对训练后的神经网络模型进行模型评估;步骤4:基于评估后的模型对目标文本数据进行文本缺陷检测,并将检测结果进行反馈。