← 返回列表

一种关键词识别方法、装置和设备

申请号: CN202311550578.X
申请人: 北京天防安全科技有限公司
申请日期: 2023/11/21

摘要文本

本申请涉及信息技术技术领域,尤其是涉及一种关键词识别方法、装置和设备,该方法包括:获取待检索日志以及预设关键词;获取字符识别模型,字符识别模型是基于多个字符各自对应的训练向量文件集对KNN模型进行训练得到,每个字符的训练向量文件集包括字符的不同样式对应的向量文件;利用字符识别模型,确定待检索日志中的各个待检索字符对应的相似度集,其中,每个待检索字符对应的相似度集包括待检索字符与多个字符各自对应的相似度值;根据待检索日志中的各个待检索字符对应的相似度集和各个关键字符,确定待检索日志中是否存在预设关键词,能够提高检索准确度,降低误检概率。

专利详细信息

项目 内容
专利名称 一种关键词识别方法、装置和设备
专利类型 发明申请
申请号 CN202311550578.X
申请日 2023/11/21
公告号 CN117591630A
公开日 2024/2/23
IPC主分类号 G06F16/33
权利人 北京天防安全科技有限公司
发明人 丁国益; 张永元; 何海军; 段伟恒
地址 北京市海淀区北三环西路32号楼16层1810-1

专利主权项内容

1.一种关键词识别方法,其特征在于,包括:获取待检索日志以及预设关键词,其中,所述预设关键词包括多个关键字符;获取字符识别模型,所述字符识别模型是基于多个字符各自对应的训练向量文件集对KNN模型进行训练得到的,每个字符对应的训练向量文件集包括字符的不同样式对应的向量文件;利用所述字符识别模型,确定所述待检索日志中的各个待检索字符对应的相似度集,其中,每个待检索字符对应的相似度集包括待检索字符与所述多个字符各自对应的相似度值;根据所述待检索日志中的各个待检索字符对应的相似度集和各个关键字符,确定所述待检索日志中是否存在所述预设关键词。