← 返回列表

一种基于集成学习的代码片段敏感信息检测方法

申请号: CN202311163836.9
申请人: 暨南大学
更新日期: 2026-03-09

专利详细信息

项目 内容
专利名称 一种基于集成学习的代码片段敏感信息检测方法
专利类型 发明申请
申请号 CN202311163836.9
申请日 2023/9/11
公告号 CN117421730A
公开日 2024/1/19
IPC主分类号 G06F21/56
权利人 暨南大学
发明人 魏林锋; 何卓丰; 丁振杨; 李学明; 黄宇勤; 李开源; 欧阳航
地址 广东省广州市天河区黄埔大道西601号

摘要文本

暨南大学获取“一种透气窗帘布”专利技术,本发明公开了一种基于集成学习的代码片段敏感信息检测方法,包括S1、对训练样本进行预处理,初始化配置文件;S2、从训练样本中提取特征,建立特征矩阵;S3、建立SVM‑AdaBoost模型并对该模型进行训练;S4、用训练好的SVM‑AdaBoost模型检测待测代码片段,初步判断代码片段是否存在敏感信息,并对存在敏感信息对样本进行自动标记。本发明加强了代码片段中敏感信息的检测能力,减少了人工检测的成本,同时基于集成学习结合多个基学习器可以获得比任意单个基学习器都要好的检测效果。

专利主权项内容

1.一种基于集成学习的代码片段敏感信息检测方法,其特征在于,包括如下步骤 : S1、对训练样本进行预处理,初始化配置文件;S2、从训练样本中提取特征,建立特征矩阵;S3、建立SVM-AdaBoost模型并对该模型进行训练;S4、用训练好的SVM-AdaBoost模型检测待测代码片段,初步判断代码片段是否存在敏感信息,并对存在敏感信息对样本进行自动标记。