一种预测硬盘异常状态的系统
摘要文本
本发明为一种预测硬盘异常状态的系统,涉及数据处理技术领域,包括:处理器和存储有计算机程序的存储器,当计算机程序被处理器执行时,实现以下步骤:获取目标硬盘数据列表集,对目标硬盘数据集进行特征筛选,获取第一硬盘数据列表和第二硬盘数据列表,第一硬盘数据列表输入至第一模块中,获取第三硬盘数据列表,将第二硬盘数据列表和第三硬盘数据列表输入至第二模块,获取目标硬盘对应的标签数据,本发明能够捕获硬盘异常状态之前的异常信息,使得正负样本数据更加平衡;在获取到硬盘对应的SMART数据进行特征筛选使得获取到的硬盘数据更加有效,提高了预测硬盘异常状态模型的准确性。
申请人信息
- 申请人:中国民航大学
- 申请人地址:300300 天津市东丽区津北公路2898号
- 发明人: 中国民航大学
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种预测硬盘异常状态的系统 |
| 专利类型 | 发明授权 |
| 申请号 | CN202410024906.0 |
| 申请日 | 2024/1/8 |
| 公告号 | CN117520104B |
| 公开日 | 2024/3/29 |
| IPC主分类号 | G06F11/30 |
| 权利人 | 中国民航大学 |
| 发明人 | 李国; 侯雪雪; 李静 |
| 地址 | 天津市东丽区津北公路2898号 |
专利主权项内容
1.一种预测硬盘异常状态的系统,其特征在于,所述系统包括:处理器和存储有计算机程序的存储器,当所述计算机程序被处理器执行时,实现以下步骤:S100,获取目标硬盘对应的目标硬盘数据列表集,其中,所述目标硬盘为待检测硬盘,所述目标硬盘数据列表集包括若干个目标硬盘数据列表,所述目标硬盘数据列表包括若干个目标硬盘数据,所述目标硬盘数据为基于初始硬盘运行特征获取到的目标硬盘对应的SMART数据,其中,所述初始硬盘运行特征为硬盘在运行时表征出的特征;S200,根据目标硬盘数据列表集,获取第一硬盘数据列表和第二硬盘数据列表,其中,所述第一硬盘数据列表包括若干个第一硬盘数据,所述第一硬盘数据为从目标硬盘数据列表中获取到的仅包括目标硬盘运行特征且处于异常状态的SMART数据,所述第二硬盘数据列表包括若干个第二硬盘数据,所述第二硬盘数据为从目标硬盘数据列表中获取到的仅包括目标硬盘运行特征且除第一硬盘数据之外的SMART数据,其中,在S200中通过如下步骤获取目标硬盘运行特征:S201,获取关键硬盘数据列表集A={A,……,A,……,A},A={A,……,A,……,A},其中,A为第i个关键硬盘对应的第j个关键硬盘数据列表,所述关键硬盘数据列表包括若干个关键硬盘数据,所述关键硬盘数据为基于初始硬盘运行特征获取到的关键硬盘对应的SMART数据,j=1……m,m为初始硬盘运行特征的数量,i=1……n,n为关键硬盘的数量,所述关键硬盘为存在异常状态的用于训练获取目标硬盘运行特征的硬盘;1inii1ijimijS203,根据A,获取A对应的候选得分列表集B={B,……,B,……,B},B={B,……,B,……,B},B={B,……,B,……,B},B为A对应的第r类候选得分列表中的第j个候选得分,r=1……s,s为候选得分类型的数量,其中,所述候选得分为基于A利用不同的特征重要性获取算法获取到的每个初始硬盘运行特征对应的得分,其中,s=5,当r=1时,B为第i个关键硬盘基于第j个初始硬盘运行特征对应的数据与关键硬盘对应的标签数据之间关系强度获取到的得分,当r=2时,B为第i个关键硬盘基于第j个初始硬盘运行特征对应的数据与关键硬盘对应的标签数据之间相关方向获取到的得分,当r=3时,B为基于随机森林模型获取到的第i个关键硬盘在第j个初始硬盘运行特征对应的数据中加入噪声数据后分类精度降低的程度,当r=4时,B为基于XGBoot模型获取到的第i个关键硬盘对应的第j个初始硬盘运行特征对应的得分,当r=5时,B为基于Relief特征选择算法获取到的第i个关键硬盘对应的第j个初始硬盘运行特征对应的得分;1inii1irisirir1irjirmirjii1ji2ji3ji4ji5jS205,根据A和B,获取候选优先级列表D={D,……,D,……,D},D为第j个初始硬盘运行特征对应的候选优先级,其中,D符合如下条件:0010j0m0j0j
,ω为B对应的数值中小数部分从小数第一位开始到第一个非零的数所包括的数字的数量,ɛ为将B中的候选得分按照从大到小的顺序进行排序后B所在位置对应的序号;irjirjirjirirjS207,根据D,获取目标优先级列表D={D,……,D,……,D},D为第i个初始硬盘运行特征对应的目标优先级,其中,D符合如下条件:01iniiD=(D-D)/(D-D),其中,D为D中最小的候选优先级,D为D中最大的候选优先级;i0i1211020S209,当D≥FD时,获取对应的初始硬盘运行特征为目标硬盘运行特征,其中,FD为预设的优先级阈值;iS300,将第一硬盘数据列表输入至第一模块中,获取第三硬盘数据列表,其中,所述第三硬盘数据列表包括若干个第三硬盘数据,所述第三硬盘数据为对第一硬盘数据进行数据增强获取到的数据,所述第一模块为进行数据增强的模块;S400,将第二硬盘数据列表和第三硬盘数据列表输入至第二模块,获取目标硬盘对应的标签数据以实现对目标硬盘异常状态的预测,其中,所述第二模块为获取目标硬盘标签数据的模块。 关注公众号马 克 数 据 网