← 返回列表

一种混合特征筛选和超参数优化的PSO-XGBoost系统构建方法

申请号: CN202311517544.0
申请人: 浙江大学
申请日期: 2023/11/14

摘要文本

本发明涉及混合特征筛选和超参数优化的PSO‑XGBoost系统构建方法,包括:对数据集进行预览和预处理;采用Pearson相关系数分析预处理后的数据集中特征之间的相关性,删除原始数据集中线性相关性大于预设阈值的特征,得到特征子集;将特征子集划分为训练集和测试集;基于PSO算法对训练集进行特征选择和XGBoost模型的超参数混合优化,输出最优特征子集和XGBoost模型的最优超参数组合;基于最优特征子集和XGBoost模型的最优超参数组合构建PSO‑XGBoost系统;基于测试集对PSO‑XGBoost系统进行测试,输出预测结果,在预测结果满足预设条件的情况下,完成PSO‑XGBoost系统的构建。其有益效果是,实现了机器学习算法处理大数据时进行特征筛选以实现数据降维和模型超参数优化这两个关键问题的并行化处理。

专利详细信息

项目 内容
专利名称 一种混合特征筛选和超参数优化的PSO-XGBoost系统构建方法
专利类型 发明申请
申请号 CN202311517544.0
申请日 2023/11/14
公告号 CN117574274A
公开日 2024/2/20
IPC主分类号 G06F18/243
权利人 浙江大学
发明人 陈一宁; 王诗琪; 高大为
地址 浙江省杭州市西湖区余杭塘路866号

专利主权项内容

1.一种混合特征筛选和超参数优化的PSO-XGBoost系统构建方法,其特征在于,包括:对数据集进行预览和预处理;采用Pearson相关系数分析预处理后的数据集中特征之间的相关性,删除原始数据集中线性相关性大于预设阈值的特征,得到特征子集;将特征子集划分为训练集和测试集;基于PSO算法对训练集进行特征选择和XGBoost模型的超参数混合优化,输出最优特征子集和XGBoost模型的最优超参数组合;基于最优特征子集和XGBoost模型的最优超参数组合构建PSO-XGBoost系统;基于测试集对PSO-XGBoost系统进行测试,输出预测结果,在预测结果满足预设条件的情况下,完成PSO-XGBoost系统的构建。