← 返回列表

一种基于事件图的议题关闭时间预测方法及系统

申请号: CN202311851136.9
申请人: 安徽思高智能科技有限公司
更新日期: 2026-03-09

专利详细信息

项目 内容
专利名称 一种基于事件图的议题关闭时间预测方法及系统
专利类型 发明授权
申请号 CN202311851136.9
申请日 2023/12/29
公告号 CN117493619B
公开日 2024/3/26
IPC主分类号 G06F16/901
权利人 安徽思高智能科技有限公司
发明人 袁水平; 裴学良; 乔雨; 王健
地址 安徽省合肥市高新区望江西路900号中安创谷科技园A1栋408

摘要文本

本发明公开了一种基于事件图的议题关闭时间预测方法,所述方法基于开源软件项目中议题的事件日志数据,挖掘事件模式;基于事件模式和事件信息生成议题事件图;使用图注意力网络构建基于事件图的议题关闭时间预测模型,最终输出议题关闭时间预测结果。本发明从挖掘议题事件模式角度出发,创新定义议题事件图,并使用图注意力网络构建基于议题事件图的议题关闭时间预测模型,能够有效捕捉影响议题关闭时间的事件因素,增强在议题关闭时间预测任务上的预测能力。

专利主权项内容

1.一种基于事件图的议题关闭时间预测方法,其特征在于:包括:S1:基于开源软件项目中议题的事件日志数据,分析议题的主要事件类型,挖掘关闭议题的事件模式,该事件模式包括通用事件模式和关键事件模式;分析议题的主要事件类型的实现过程如下:首先,基于开源项目数据中议题的时间数据,获取项目内每个已关闭议题的事件日志,统计GitHub平台定义的44种全部事件类型的数量分布;然后,通过计算事件支持度即发生过该类型事件的议题量在全部议题的数量中的占比,筛选出频繁发生的事件类型作为主要事件类型;通用事件模式的挖掘过程如下:通过应用Apriori算法的频繁项集挖掘方法,在事件模式的数据集上挖掘频繁顺序项集,作为事件类型集,设置最小支持度,将事件类型集设置为主要事件类型,获得算法输出的频繁顺序项集,即通用事件模式;其中频繁顺序项集定义如下:顺序项集内的第一项代表事件模式的第一项,第二项代表事件模式的第二项,以此类推,由k个顺序项构成的顺序项集称为k-顺序项集,在事件模式数据集内支持度大于最小支持度的顺序项集称为频繁顺序项集;顺序项集的支持度等于数据集内包含该顺序项集的事件模式数量除以事件模式的总数,计算方式如下:其中,代表数据集内事件模式的总数,/>代表包含该顺序项集的事件模式数量,/>代表顺序项集的支持度,事件模式/>包含顺序项集,顺序项集的项数n不大于事件模式的项数m,m、n均为正整数;关键事件模式的挖掘过程如下:S1.4.1、统计议题关闭时间分布,将议题关闭时间划分为多个关闭时间类别,根据关闭时间类别将议题关闭时间划分为短期T1、中期T2、长期T3三种类型,并将关闭时间阶段T作为最后一项元素,加入到议题对应的事件模式中,构建包含关闭时间信息的议题事件模式[L, L, L, ..., T],其中,T为T1、T2、T3中的一个;123S1.4.2、通过Apriori算法的频繁项集挖掘方法在数据集上挖掘与关闭时间阶段有关联的频繁顺序项集;将事件类型集设置为主要事件类型和三种关闭时间阶段,获得频繁顺序项集后,剔除掉不包含T的频繁顺序项集;包含关闭时间信息的议题事件模式的顺序项集的支持度等于议题数据集内包含该顺序项集的事件模式的数量除以数据总量;其中,一个事件模式[L, L, ..., L, T]包含一个顺序项集{L, L, ..., L, T},被包含的顺序项集的项数n不大于事件模式的项数m,事件模式的前n项等于被包含的顺序项集,并且关闭时间阶段T相等;12m12nS1.4.3、在步骤S1.4.2获取的频繁顺序项集基础上,设置最小置信度,应用Apriori算法的关联规则学习方法,获取与关闭时间阶段有关的关联规则,即关键事件模式;S2:基于事件模式和事件信息构建议题事件图;步骤S2的实现过程如下:S2.1、根据事件模式定义议题事件图的节点,根据事件信息添加图节点标签:定义议题的事件模式中的每一个顺序项为议题事件图的节点,图节点标签为事件类型名称,图节点的基础属性包含是否为议题的创建者和事件发起者在项目中的身份类型,所述身份类型包括成员、贡献者、合作者、所有者;S2.2、根据事件模式构建节点之间的边:基于议题事件发生的前后顺序构建有向边,边的方向为从前一项发生的事件类型节点指向紧邻的后一项发生的事件类型节点,边的权重为在议题的全部事件中该事件走向的发生次数;S2.3、根据事件图的节点和边,构建议题事件图,根据议题事件图分别获取该议题事件图对应的邻接矩阵和属性矩阵;S3:基于议题事件图,使用图注意力网络构建基于事件图的议题关闭时间预测模型,输出议题关闭时间预测结果。