一种单一特征排序及复合特征提取方法
摘要文本
电子科技大学取得“一种透气窗帘布”专利技术,本发明公开了一种单一特征排序及复合特征提取方法,属于数据处理技术领域。该方法包括以下步骤:S1.构建输入数据集;S2.划分聚类;S3.分聚类进行符号回归,并将符号回归结果解码为表达式;S4.根据符号回归结果进行单一特征排序;S5.根据符号回归结果提取复合特征。本发明方法能够有效提升单一特征选择结果的可解释性,剔除不相关或冗余的特征;同时,能够显式的提取出符合领域可解释性的复合特征,从而促进跨领域之间的知识交流;此外,选取出真正相关的特征能够有效去除噪声特征带来的干扰,从而简化模型,提高模型精确度,协助理解数据产生的过程。
专利主权项内容
1.一种单一特征排序及复合特征提取方法,其特征在于,用于对镍基高温合金的样本数据进行数据处理,得到单一特征排序并提取复合特征;包括以下步骤:S1.构建输入数据集:每个镍基高温合金的样本数据均包括蠕变寿命、γ’体积分数、剪切模量、反相畴界能、堆垛层错能、γ’熔化温度、错配度、初始蠕变速率、外加应力和蠕变温度;对于待处理镍基高温合金的样本数据,选择样本数据中的待优化参数作为标签,选取至少3个待筛选特征作为相关特征;将样本的相关特征经过数据预处理后与所对应的标签进行拼接,得到单个样本的输入数据,完成输入数据集的构建;S2.划分聚类:将输入数据集进行聚类划分,得到每个样本所处的聚类;S3.符号回归:按照聚类划分结果,分聚类进行符号回归;在符号回归过程中,各个聚类的超参数保持一致,以均方根误差作为适应度函数;在符号回归迭代结束后,将符号回归结果解码为表达式,得到各个聚类的表达式;S4.单一特征排序:统计每个相关特征在表达式中出现的频次,得到各相关特征出现的总次数;同时,在每个表达式中选择拟合误差小于设定阈值的样本,并在所选择的样本中差分计算每个相关特征在表达式中的偏导数平均值;然后根据每个相关特征出现的总次数与每个相关特征在表达式中的偏导数平均值进行非支配排序,得到相关特征对待优化参数的影响程度排序结果;S5.复合特征提取:在表达式中提取出现频次大于设定阈值的子结构,利用主成分分析法或相关系数法筛选提取到的子结构,得到复合特征。 微信公众号马克数据网
专利申请信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种单一特征排序及复合特征提取方法 |
| 专利类型 | 发明授权 |
| 申请号 | CN202311753604.9 |
| 申请日 | 2023/12/20 |
| 公告号 | CN117435904B |
| 公开日 | 2024/3/15 |
| IPC主分类号 | G06F18/2111 |
| 权利人 | 电子科技大学 |
| 发明人 | 胡旺; 陈业航; 章语; 李欣悦 |
| 地址 | 四川省成都市高新区(西区)西源大道2006号 |