← 返回列表

一种基于决策树的根因挖掘分析方法及系统

申请号: CN202311723832.1
申请人: 江西求是高等研究院
申请日期: 2023/12/15

摘要文本

本发明提供了一种基于决策树的根因挖掘分析方法及系统,所述方法包括提取CFR目标,并从订单数据中提取不达标订单数据;提取不达标订单数据的订单特征,将订单特征进行独热编码,以得到若干编码特征,将编码特征进行组合,以得到组合特征;对组合特征中的每个子特征进行分支选择,并在子特征中选取根节点,基于根节点与组合特征构建回归决策树;遍历回归决策树的每条路径并确定每条路径对应的超卖值,将超卖值超出超卖阈值所对应的路径作为决策路径,提取决策路径的特征组合,以得到根因分析结果,本发明采用回归决策树模型进行训练和特征提取,在保持较高分析准确率的同时,能够快速识别影响订单满足率的关键维度组合。

专利详细信息

项目 内容
专利名称 一种基于决策树的根因挖掘分析方法及系统
专利类型 发明授权
申请号 CN202311723832.1
申请日 2023/12/15
公告号 CN117408787B
公开日 2024/3/5
IPC主分类号 G06Q30/0601
权利人 江西求是高等研究院
发明人 张立凡; 刘晨
地址 江西省南昌市红谷滩区学府大道899号慧谷产业园3期8号楼

专利主权项内容

1.一种基于决策树的根因挖掘分析方法,其特征在于,包括:在订单数据库中选取预设时间范围内的订单数据,提取所述预设时间范围内的CFR目标,并根据所述CFR目标从所述订单数据中提取不达标订单数据;其中,所述CFR目标为客户满足率目标;提取所述不达标订单数据的订单特征,将所述不达标订单数据的订单特征进行独热编码,以得到若干编码特征,将所述编码特征进行组合,以得到组合特征,其中,所述编码特征为一串由布尔值1或0组成的特征字符;其中,将订单数据中的将所有产品编号、所有订单所在日期、所有发货地、所有分销商都记作一个状态位,对每个订单的特征信息通过独热编码进行表达,从而实现维度列转行,每列为布尔值1或0,以此得到若干个编码特征,之后按照订单特征的排序关系,将其以此排列,以此得到一串特征字符,即为组合特征;对所述组合特征中的每个子特征进行分支选择,并在所述子特征中选取主特征作为根节点,基于所述根节点与所述组合特征构建回归决策树;遍历所述回归决策树的每条路径并确定每条路径对应的超卖值,将所述超卖值超出超卖阈值所对应的路径作为决策路径,提取所述决策路径的特征组合,以得到根因分析结果;其中,所述超卖值的计算公式为∣B-C∣/B,B为产品需求量,C为实际供货量;所述对所述组合特征中的每个子特征进行分支选择,并在所述子特征中选取主特征作为根节点的步骤包括:将所述组合特征中的每个特征字符作为所述组合特征的子特征,对每个所述子特征均进行分支选择,以使每个所述子特征均存在与之对应的两个分选节点;每位特征字符均作为子特征,因此组合特征中特征字符的数量等于子特征的数量,通过判断子特征对应的特征字符是否为1,得到两个分选节点,一个分选节点为该子特征对应的特征字符为1,另一个分选节点为该子特征对应的特征字符为0;基于两个所述分选节点对应的超卖值,并基于所述分选节点对应的超卖值计算信息熵增益;将信息熵增益最大时对应的子特征作为主特征,并将所述主特征作为根节点;基于所述根节点将所述组合特征划分为若干子节点,对每个所述子节点均进行分支选择、信息熵增益计算、根节点选择,以得到新根节点;采用递归方式并基于所述新根节点将所述子节点进行划分,以得到若干新子节点,通过递归方式对所述新子节点进行分支选择、信息熵增益计算、根节点选择;若递归过程满足停止条件,则输出回归决策树,若递归过程不满足停止条件,则继续递归过程;所述若递归过程满足停止条件,则输出回归决策树,若递归过程不满足停止条件,则继续递归过程的步骤包括:计算当前递归过程中得到的若干新子节点的超卖值,并计算若干新子节点的超卖值之间的超卖差值;判断所述超卖差值是否大于差值阈值;若所述超卖差值大于差值阈值,则所述递归过程不满足停止条件并继续递归过程,若所述超卖差值不大于差值阈值,则所述递归过程满足停止条件并输出回归决策树。 (更多数据,详见马克数据网)