← 返回列表
一种混合特征筛选和超参数优化的PSO-XGBoost系统构建方法
摘要文本
本发明涉及混合特征筛选和超参数优化的PSO‑XGBoost系统构建方法,包括:对数据集进行预览和预处理;采用Pearson相关系数分析预处理后的数据集中特征之间的相关性,删除原始数据集中线性相关性大于预设阈值的特征,得到特征子集;将特征子集划分为训练集和测试集;基于PSO算法对训练集进行特征选择和XGBoost模型的超参数混合优化,输出最优特征子集和XGBoost模型的最优超参数组合;基于最优特征子集和XGBoost模型的最优超参数组合构建PSO‑XGBoost系统;基于测试集对PSO‑XGBoost系统进行测试,输出预测结果,在预测结果满足预设条件的情况下,完成PSO‑XGBoost系统的构建。其有益效果是,实现了机器学习算法处理大数据时进行特征筛选以实现数据降维和模型超参数优化这两个关键问题的并行化处理。
申请人信息
- 申请人:浙江大学
- 申请人地址:310000 浙江省杭州市余杭塘路866号
- 发明人: 浙江大学
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种混合特征筛选和超参数优化的PSO-XGBoost系统构建方法 |
| 专利类型 | 发明申请 |
| 申请号 | CN202311517544.0 |
| 申请日 | 2023/11/14 |
| 公告号 | CN117574274A |
| 公开日 | 2024/2/20 |
| IPC主分类号 | G06F18/243 |
| 权利人 | 浙江大学 |
| 发明人 | 陈一宁; 王诗琪; 高大为 |
| 地址 | 浙江省杭州市西湖区余杭塘路866号 |
专利主权项内容
1.一种混合特征筛选和超参数优化的PSO-XGBoost系统构建方法,其特征在于,包括:对数据集进行预览和预处理;采用Pearson相关系数分析预处理后的数据集中特征之间的相关性,删除原始数据集中线性相关性大于预设阈值的特征,得到特征子集;将特征子集划分为训练集和测试集;基于PSO算法对训练集进行特征选择和XGBoost模型的超参数混合优化,输出最优特征子集和XGBoost模型的最优超参数组合;基于最优特征子集和XGBoost模型的最优超参数组合构建PSO-XGBoost系统;基于测试集对PSO-XGBoost系统进行测试,输出预测结果,在预测结果满足预设条件的情况下,完成PSO-XGBoost系统的构建。