一种基于全流程并行遗传算法的贝叶斯网络结构学习算法
摘要文本
本发明涉及一种基于全流程并行遗传算法的贝叶斯网络结构学习算法,属于信息处理及人工智能技术领域。本发明基于遗传算法来构建贝叶斯网络结构学习算法,能够更广泛地探索搜索空间、提高搜索效率;同时,一方面通过寻找两个节点间边的生成来简化BN结构的搜索,另一方面采用全流程并行计算的方式来进一步提高搜索效率,并使用BIC作为评分函数来解决数似然度和结构复杂度的权衡问题。。
申请人信息
- 申请人:江南大学
- 申请人地址:214000 江苏省无锡市新吴区净慧东道66号(江南大学国家大学科技园)
- 发明人: 江南大学
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种基于全流程并行遗传算法的贝叶斯网络结构学习算法 |
| 专利类型 | 发明申请 |
| 申请号 | CN202311388156.7 |
| 申请日 | 2023/10/24 |
| 公告号 | CN117474106A |
| 公开日 | 2024/1/30 |
| IPC主分类号 | G06N7/01 |
| 权利人 | 江南大学 |
| 发明人 | 马力; 蔡一鸣; 方伟; 陆恒杨; 朱书伟; 张欣 |
| 地址 | 江苏省无锡市滨湖区蠡湖大道1800号 |
专利主权项内容
1.一种基于全流程并行遗传算法的贝叶斯网络结构学习算法,其特征在于,包括如下步骤:步骤1:初始化贝叶斯网络结构和管道信息,同时加载样本数据集和设置算法所需的初始全局变量,所述管道用于在不同步骤间传递数据和信息;步骤2:在多个节点并行计算互信息MI,判断任意两个节点的互信息MI计算结果是否满足阈值公式,从而判断两个节点间是否存在一条相连接的边,且其余节点对相关性小、无法连接;步骤3:将满足阈值公式的节点对编码为1,将不满足的节点编码为0,从而构建出互信息矩阵,随后用互信息矩阵随机生成多个超结构,所述超结构为无向图结构;步骤4:对于每一个超结构,构造一组条件集合S,所述条件集合S包括多个取值条件,所述取值条件是所需要计算次数的变量或变量对,随后将取值条件广播到不同的节点,在每个节点上对需要构建贝叶斯网络结构的数据集进行并行搜索条件集合S,并对相同的取值条件进行聚合,以获取它们在样本中出现的次数,并行统计所有取值条件在需要构建贝叶斯网络结构的数据集中出现的次数,计算出所有取值条件的出现的次数后能够通过BIC计算公式计算出超结构的BIC值;bicbicbic步骤5:以步骤3中的多个超结构为种群,将种群信息广播到每个节点,确保每个节点能够独立访问所述种群的所有个体信息;步骤6:构造信息列表,将信息列表广播并构造分布式选择信息,使得每个节点都有一条信息用于分布式选择,并且从信息列表里额外选择两条信息列表中的信息加入每个节点;每个节点通过信息能够查询到两个个体,进行并行的锦标赛选择,并同时对未选择的个体进行并行的交叉操作从而得到下一代个体;步骤7:对步骤6所得到的下一代个体进行变异操作。