一种日志数据分析方法及系统
摘要文本
本申请提供一种日志数据分析方法及系统。一种日志数据分析系统,包括:兴趣主题分类模块、日志数据获取模块、正负面热度值计算模块、用户活跃度评分模块、正负面热度值模拟模块、用户活跃度评分预测模块、误差异常告警模块和最佳模拟正负面热度值输出模块。本申请通过历史用户日志数据构建平台内以正负面博文热度值为影响因素的用户活跃度评分模型,以上一个时间周期的正负面博文热度值为基数,根据用户活跃度评分模型对本时间周期的用户活跃度进行模拟预测,辅助平台人员调整正负面博文的推送策略,提高平台用户的活跃度。
申请人信息
- 申请人:河北数港科技有限公司
- 申请人地址:066000 河北省秦皇岛市北戴河区联峰路72号102室
- 发明人: 河北数港科技有限公司
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种日志数据分析方法及系统 |
| 专利类型 | 发明申请 |
| 申请号 | CN202311593240.2 |
| 申请日 | 2023/11/27 |
| 公告号 | CN117635190A |
| 公开日 | 2024/3/1 |
| IPC主分类号 | G06Q30/0201 |
| 权利人 | 河北数港科技有限公司 |
| 发明人 | 褚国辉; 王东旭; 张永超; 杨桢; 史婷婷; 李想 |
| 地址 | 河北省秦皇岛市北戴河区联峰路72号102室 |
专利主权项内容
1.一种日志数据分析方法,其特征在于,具体实现步骤如下:获取平台历史用户日志数据,获取平台所有博文的兴趣词条,对平台所有博文的兴趣词条进行分类,将平台所有博文的兴趣词条分为多种兴趣主题,对每种兴趣主题进行编号,得到兴趣主题编号;根据每种兴趣主题和其对应的平台历史用户日志数据得到每个时间周期内每种兴趣主题对应的正面热度值、负面热度值和用户活跃度评分;将根据时间先后顺序对每个时间周期进行编号,得到每个时间周期的时序编号;根据每种兴趣主题对应的正面热度值、负面热度值、每个时间周期的时序编号和用户活跃度评分构建每种兴趣主题对应的用户活跃度评分模型;获取上一时间周期的用户日志数据,并根据上一时间周期的用户日志数据获取上一时间周期每种兴趣主题对应的正面热度值、负面热度值和用户活跃度评分;将上一时间周期每种兴趣主题对应的时序编号、正面热度值和负面热度值送入对应兴趣主题的用户活跃度评分模型,得到上一时间周期每种兴趣主题对应的预测用户活跃度评分;将上一时间周期每种兴趣主题对应的预测用户活跃度评分与上一时间周期每种兴趣主题对应的用户活跃度评分进行对比,逐一判断上一时间周期每种兴趣主题对应的预测用户活跃度评分和上一时间周期每种兴趣主题对应的用户活跃度评分的误差是否大于预设活跃度误差,若某种兴趣主题对应的预测用户活跃度评分和上一时间周期该种兴趣主题对应的用户活跃度评分的误差大于预设活跃度误差,假定该种兴趣主题的编号为i,则输出“编号为i的兴趣主题预测活跃度误差过大”告警提示;若该种兴趣主题对应的预测用户活跃度评分和上一时间周期该种兴趣主题对应的用户活跃度评分的误差不大于预设活跃度误差,则建立该种兴趣主题对应的模拟正面热度值集合和模拟负面热度值集合,根据该种兴趣主题对应的模拟正面热度值集合和模拟负面热度值集合和该种兴趣主题对应的用户活跃度评分模型获取最佳模拟正面热度值和最佳模拟负面热度值。 该数据由<马克数据网>整理