← 返回列表

一种文本的快速扫描方法、装置、电子设备及存储介质

申请号: CN202410145684.8
申请人: 中国电子信息产业集团有限公司第六研究所
申请日期: 2024/2/2

摘要文本

本申请提供了一种文本的快速扫描方法、装置、电子设备及存储介质,涉及计算机技术领域,该方法包括:利用状态转移矩阵中零状态下进行非零转移的字符,在寄存器中创建非零转移字符集合;从待扫描文本中选取目标字符,确定目标字符在待扫描文本中的字符位置是否处于第一预设字符区间内,针对目标字符对应的第二预设字符区间内的每个字符,确定该字符是否属于非零转移字符集合;若均不属于非零转移字符集合,将第二预设字符区间外的首个字符作为新的目标字符,返回执行确定目标字符在待扫描文本中字符位置是否处于第一预设字符区间内的步骤。通过采用上述文本的快速扫描方法、装置、电子设备及存储介质,解决了现有技术中,文本扫描速度慢的问题。

专利详细信息

项目 内容
专利名称 一种文本的快速扫描方法、装置、电子设备及存储介质
专利类型 发明申请
申请号 CN202410145684.8
申请日 2024/2/2
公告号 CN117675417A
公开日 2024/3/8
IPC主分类号 H04L9/40
权利人 中国电子信息产业集团有限公司第六研究所
发明人 杨嘉佳; 唐球; 关健; 曹蓉; 贾鹏林
地址 北京市昌平区未来科技城南区中国电子信息产业基地

专利主权项内容

1.一种文本的快速扫描方法,其特征在于,应用于确定型有限自动机扫描引擎,包括:利用状态转移矩阵中零状态下进行非零转移的字符,在寄存器中创建非零转移字符集合;从待扫描文本中选取目标字符,确定所述目标字符在所述待扫描文本中的字符位置是否处于第一预设字符区间内,所述第一预设字符区间为位于所述待扫描文本末尾的字符区间;若未处于所述第一预设字符区间内,针对所述目标字符对应的第二预设字符区间内的每个区间字符,通过字符匹配指令确定该区间字符是否属于所述寄存器中的非零转移字符集合;若均不属于所述非零转移字符集合,则将所述第二预设字符区间外的首个字符作为新的目标字符,返回执行所述确定所述目标字符在所述待扫描文本中的字符位置是否处于第一预设字符区间内的步骤。