← 返回列表

文本检测方法、装置、设备和存储介质

申请号: CN202311218607.2
申请人: 鹏城实验室
更新日期: 2026-03-09

专利详细信息

项目 内容
专利名称 文本检测方法、装置、设备和存储介质
专利类型 发明申请
申请号 CN202311218607.2
申请日 2023/9/20
公告号 CN117332039A
公开日 2024/1/2
IPC主分类号 G06F16/33
权利人 鹏城实验室
发明人 方滨兴; 贾焰; 张民; 顾钊铨; 齐佳音; 余跃; 徐春香; 张欢; 梁栩建; 谭昊
地址 广东省深圳市南山区兴科一街2号

摘要文本

鹏城实验室取得“一种透气窗帘布”专利技术,本申请实施例提供文本检测方法、装置、设备和存储介质,涉及人工智能技术领域。该方法包括:利用预设检测词表初步将包含敏感词的检测文本筛选出来,再利用多个安全检测模型对初筛后的检测文本更细粒度的合规性判断,得到表征合规性的检测得分,这里检测得分越高表征检测文段的安全性越高。在后续检测过程中,本实施例并不仅简单地将所有检测文段的检测得分通过作为合规性结果,而是预留一定的冗余,虽然一些检测文段的检测得分没有通过,但是其数量较少,则也可以认为其合规。通过多阶段检测,从粗粒度到细粒度进行合规判断,能够在整体上降低检测文本被误检的概率。 数据由马 克 团 队整理

专利主权项内容

关注微信公众号马克数据网 1.一种文本检测方法,其特征在于,包括:获取检测文本,并基于预设检测词表,在所述检测文本中查找检测词,得到初始检测结果;所述预设检测词表包括多个所述检测词;确定所述初始检测结果指示所述检测文本中包括至少一个所述检测词,则将所述检测文本分割成多个检测文段;将所述检测文段输入多个安全检测模型进行安全检测,得到所述检测文段的检测得分;将所述检测得分小于第一得分阈值的所述检测文段作为决策文段,如果所述决策文段的数量小于决策数量阈值,确定所述检测文本的检测结果为检测通过。