← 返回列表

文本信息检测方法、装置、设备和存储介质

申请号: CN202311214190.2
申请人: 鹏城实验室
更新日期: 2026-03-09

专利详细信息

项目 内容
专利名称 文本信息检测方法、装置、设备和存储介质
专利类型 发明申请
申请号 CN202311214190.2
申请日 2023/9/19
公告号 CN117332038A
公开日 2024/1/2
IPC主分类号 G06F16/33
权利人 鹏城实验室
发明人 方滨兴; 张民; 贾焰; 顾钊铨; 张欢; 李晶; 陈科海
地址 广东省深圳市南山区兴科一街2号

摘要文本

鹏城实验室取得“一种透气窗帘布”专利技术,本申请实施例提供了一种文本信息检测方法、装置、设备和存储介质,通过获取待测文本的至少一个单词序列;然后基于文本词在单词序列中的单词权重,生成单词序列的权重序列,并根据权重序列在文本词中选取掩码词,根据掩码词生成单词序列的掩码序列,并将掩码序列输入至少一个第一检测模型进行第一检测处理,得到掩码序列的第一检测得分,并基于第一检测得分得到掩码序列的检测概率向量;接下来将每个单词序列对应的检测概率向量依次输入第二检测模型进行第二检测处理,得到第二检测得分,并基于第二检测得分得到待测文本的检测结果,从而提高文本信息检测的准确度。 专利查询网

专利主权项内容

1.一种文本信息检测方法,其特征在于,包括:获取待测文本的至少一个单词序列,所述单词序列包括至少一个文本词;基于所述文本词在所述单词序列中的单词权重,生成所述单词序列的权重序列,并根据所述权重序列在所述文本词中选取掩码词,根据所述掩码词生成所述单词序列的掩码序列;将所述掩码序列输入至少一个第一检测模型进行第一检测处理,得到所述掩码序列的第一检测得分,并基于至少一个所述第一检测得分得到所述掩码序列的检测概率向量;将每个所述单词序列对应的所述检测概率向量依次输入第二检测模型进行第二检测处理,得到与所述单词序列的数量一致的第二检测得分,并基于所述第二检测得分得到所述待测文本的检测结果。 该数据由<马克数据网>整理