← 返回列表
一种基于ROUGE指标和LOF算法的业务流程不频繁行为挖掘方法
申请人信息
- 申请人:山东科技大学
- 申请人地址:266590 山东省青岛市黄岛区前湾港路579号
- 发明人: 山东科技大学
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种基于ROUGE指标和LOF算法的业务流程不频繁行为挖掘方法 |
| 专利类型 | 发明申请 |
| 申请号 | CN202311723866.0 |
| 申请日 | 2023/12/15 |
| 公告号 | CN117689467A |
| 公开日 | 2024/3/12 |
| IPC主分类号 | G06Q40/03 |
| 权利人 | 山东科技大学 |
| 发明人 | 田银花; 武于皓; 张睿哲; 韩咚; 刘子豪 |
| 地址 | 山东省青岛市黄岛区前湾港路579号 |
摘要文本
本发明公开了一种基于ROUGE指标和LOF算法的业务流程不频繁行为挖掘方法,包括获取事件日志L,根据事件日志L计算轨迹数据的距离矩阵,获得每个轨迹数据的可达性矩阵,对于每个轨迹数据,计算局部可达密度,计算每个轨迹数据的LOF值,判断轨迹数据是否为不频繁行为。本发明从事件日志中提取事件轨迹、频率和标签等信息,并借鉴机器翻译领域的评估指标ROUGE作为轨迹之间的相似度度量指标,通过改进的LOF算法来挖掘不频繁行为。该方法综合考虑了局部密度、频率信息和轨迹之间的相似性。通过使用真实的事件数据评估,并与两种聚类方法进行比较实验。实验结果表明,该方法能够快速处理事件日志,从中识别出不频繁行为,提供可靠的不频繁行为挖掘结果。
专利主权项内容
1.一种基于ROUGE指标和LOF算法的业务流程不频繁行为挖掘方法,其特征在于,包括以下步骤:步骤1:获取数据集data,从数据集data中获取事件日志L,事件日志L中包括多个轨迹数据和轨迹数据对应的发生频率及轨迹长度;步骤2:根据事件日志L计算轨迹数据的距离矩阵;步骤3:对轨迹数据的距离矩阵的每一列进行升序排列,找出每个轨迹数据的第x个最近的点,两者之间距离称为临近距离,记录在数组x_distances中;步骤4:获得每个轨迹数据的可达性矩阵;步骤5:对于每个轨迹数据,计算其x个最近邻轨迹数据的局部可达密度;步骤6:计算每个轨迹数据的LOF值;步骤7:设定一个阈值T,将每个轨迹数据的LOF值与阈值比较,判断轨迹数据是否为不频繁行为。