一种基于堆叠学习算法的化合物血脑屏障渗透性预测方法
申请人信息
- 申请人:广东工业大学
- 申请人地址:510090 广东省广州市越秀区东风东路729号
- 发明人: 广东工业大学
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种基于堆叠学习算法的化合物血脑屏障渗透性预测方法 |
| 专利类型 | 发明申请 |
| 申请号 | CN202310570954.5 |
| 申请日 | 2023/5/19 |
| 公告号 | CN117577214A |
| 公开日 | 2024/2/20 |
| IPC主分类号 | G16C20/30 |
| 权利人 | 广东工业大学 |
| 发明人 | 苏庆; 肖淦耀; 周渭; 林志毅; 谢国波 |
| 地址 | 广东省广州市越秀区东风东路729号大院 |
摘要文本
本发明提出了一种基于堆叠学习算法的化合物血脑屏障渗透性预测方法,具体实现步骤如下:(1)获取化合物及其BBB标签数据;(2)对数据集进行包括特征生成、数据归一化、特征筛选、样本数量均衡化等数据预处理操作;(3)构建基学习器选择模块,根据输入经过预处理的BBB数据,应用基学习器选择机制来选择用于堆叠学习算法的基学习器;(4)构建融合学习器遴选模块,将基学习器的预测结果构造成一个堆叠矩阵,对比该堆叠矩阵在不同学习器中的训练结果,遴选出堆叠学习算法的最佳融合学习器; (5)根据选出的基学习器与融合学习器,构造化合物BBB渗透性预测模型,并应用网格搜索方法进行参数优化;(6)运用该预测模型进行化合物的BBB渗透性预测。 来自:
专利主权项内容
1.一种基于堆叠学习算法的化合物血脑屏障渗透性预测方法,其特征在于可充分考虑类别样本数量不均衡对预测结果的影响,并运用多个学习器进行融合预测以提升预测效果,该方法包括以下步骤:第一步,收集已知BBB标签的化合物,获取这些化合物的SMILES分子式,并与其对应的BBB标签组合成化合物样本,由此形成初始的数据集;第二步,对数据集进行包括特征生成、数据归一化、特征筛选、样本数量均衡化等数据预处理操作;第三步,构建基学习器选择模块,根据输入已经过预处理的BBB数据,设计一种基学习器选择机制,用于选择堆叠学习算法的基学习器;第四步,构建融合学习器遴选模块,将基学习器的预测结果构造成一个堆叠矩阵,对比该堆叠矩阵在不同学习器中的训练结果,遴选出堆叠学习算法的最佳融合学习器;第五步,根据基学习器选择模块选出的基学习器和融合学习器遴选模块遴选出的融合学习器,构造化合物BBB渗透性预测模型,并应用网格搜索方法进行参数优化;第六步,运用该预测模型进行化合物的BBB渗透性预测。