← 返回列表

一种基于ROUGE指标和LOF算法的业务流程不频繁行为挖掘方法

申请号: CN202311723866.0
申请人: 山东科技大学
更新日期: 2026-03-09

专利详细信息

项目 内容
专利名称 一种基于ROUGE指标和LOF算法的业务流程不频繁行为挖掘方法
专利类型 发明申请
申请号 CN202311723866.0
申请日 2023/12/15
公告号 CN117689467A
公开日 2024/3/12
IPC主分类号 G06Q40/03
权利人 山东科技大学
发明人 田银花; 武于皓; 张睿哲; 韩咚; 刘子豪
地址 山东省青岛市黄岛区前湾港路579号

摘要文本

本发明公开了一种基于ROUGE指标和LOF算法的业务流程不频繁行为挖掘方法,包括获取事件日志L,根据事件日志L计算轨迹数据的距离矩阵,获得每个轨迹数据的可达性矩阵,对于每个轨迹数据,计算局部可达密度,计算每个轨迹数据的LOF值,判断轨迹数据是否为不频繁行为。本发明从事件日志中提取事件轨迹、频率和标签等信息,并借鉴机器翻译领域的评估指标ROUGE作为轨迹之间的相似度度量指标,通过改进的LOF算法来挖掘不频繁行为。该方法综合考虑了局部密度、频率信息和轨迹之间的相似性。通过使用真实的事件数据评估,并与两种聚类方法进行比较实验。实验结果表明,该方法能够快速处理事件日志,从中识别出不频繁行为,提供可靠的不频繁行为挖掘结果。

专利主权项内容

1.一种基于ROUGE指标和LOF算法的业务流程不频繁行为挖掘方法,其特征在于,包括以下步骤:步骤1:获取数据集data,从数据集data中获取事件日志L,事件日志L中包括多个轨迹数据和轨迹数据对应的发生频率及轨迹长度;步骤2:根据事件日志L计算轨迹数据的距离矩阵;步骤3:对轨迹数据的距离矩阵的每一列进行升序排列,找出每个轨迹数据的第x个最近的点,两者之间距离称为临近距离,记录在数组x_distances中;步骤4:获得每个轨迹数据的可达性矩阵;步骤5:对于每个轨迹数据,计算其x个最近邻轨迹数据的局部可达密度;步骤6:计算每个轨迹数据的LOF值;步骤7:设定一个阈值T,将每个轨迹数据的LOF值与阈值比较,判断轨迹数据是否为不频繁行为。