← 返回列表

一种基于随机森林的用户状态画像异常监测方法

申请号: CN202311689787.2
申请人: 国网河南省电力公司经济技术研究院; 郑州大学; 国网智能电网研究院有限公司
申请日期: 2023/12/11

摘要文本

本发明涉及一种基于随机森林的用户状态画像异常监测方法属大数据及用户画像领域,包括采集用户历史时间段内每日的网页访问数据并进行预处理得到训练样本数据;建立每个工作日随机森林模型和不区分工作日全周随机森林模型;根据训练样本数据的登录星期特征将训练样本数据分发至每个工作日的随机森林模型和全周随机森林模型,各随机森林模型基于各自分发到的训练样本数据进行训练得到各工作日的用户状态画像模板和不区分工作日的用户状态画像模板;计算各工作日的用户状态画像模板和不区分工作日的用户状态画像模板的平均路径长度作为基线;对当前用户状态画像数据向量计算异常值得分进行用户行为异常判决。解决内部威胁监测效率低准确率低的问题。 更多数据:

专利详细信息

项目 内容
专利名称 一种基于随机森林的用户状态画像异常监测方法
专利类型 发明申请
申请号 CN202311689787.2
申请日 2023/12/11
公告号 CN117692196A
公开日 2024/3/12
IPC主分类号 H04L9/40
权利人 国网河南省电力公司经济技术研究院; 郑州大学; 国网智能电网研究院有限公司
发明人 狄立; 贾一博; 王世谦; 郭军利; 高先周; 白宏坤; 韩丁; 王圆圆; 卜飞飞; 宋大为; 黄勇; 华远鹏; 牛斌斌; 高妍; 李秋燕; 王涵
地址 河南省郑州市二七区嵩山南路87号院办公区C楼1-10层; 河南省郑州市高新区科学大道100号; 北京市昌平区未来科技城滨河大道18号

专利主权项内容

1.一种基于随机森林的用户状态画像异常监测方法,其特征在于,包括以下步骤:采集用户历史时间段内每日的网页访问数据并进行预处理,得到每日的用户状态画像数据向量作为训练样本数据;建立每个工作日的随机森林模型和不区分工作日的全周随机森林模型;根据所述训练样本数据的登录星期特征将训练样本数据分发至所述每个工作日的随机森林模型和全周随机森林模型,各随机森林模型基于各自分发到的所述训练样本数据进行训练得到各工作日的用户状态画像模板和不区分工作日的用户状态画像模板;计算各工作日的用户状态画像模板和不区分工作日的用户状态画像模板的平均路径长度作为每个模板的基线;采集当前的用户网页访问数据,形成用户状态画像数据向量输入对应画像模板得到向量在对应模板中的路径长度;基于向量在对应模板中的路径长度、各模板的基线计算当前用户状态画像数据向量的对应于各模板的异常值得分,基于所述各模板的异常值得分进行用户行为异常判决。