一种环境空气自动监测过程中异常数据处理方法
申请人信息
- 申请人:山东汇力环保科技有限公司
- 申请人地址:271000 山东省泰安市高新区南天门大街3682号创意谷4号楼一楼
- 发明人: 山东汇力环保科技有限公司
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种环境空气自动监测过程中异常数据处理方法 |
| 专利类型 | 发明授权 |
| 申请号 | CN202311763182.3 |
| 申请日 | 2023/12/21 |
| 公告号 | CN117436005B |
| 公开日 | 2024/3/15 |
| IPC主分类号 | G06F18/243 |
| 权利人 | 山东汇力环保科技有限公司 |
| 发明人 | 李强; 仇志强; 杜华安; 张辉; 刘鹏飞; 杨猛; 孟庆喜; 陈绪坤; 杜丰 |
| 地址 | 山东省泰安市高新区南天门大街3682号创意谷4号楼一楼 |
摘要文本
本发明涉及数据异常检测技术领域,具体涉及一种环境空气自动监测过程中异常数据处理方法;根据孤立森林算法构建环境变化特征序列的孤立树模型;根据孤立树模型的孤立树结构特征获得数据点的路径权重值;根据路径权重值划分标记数据点和常规数据点;在环境变化特征序列中根据标记数据点的预设关联范围内其他数据点的波动特征获得权重可信度;根据权重可信度获得修正路径权重值。本发明根据路径权重值和修正路径权重值获得加权路径长度;根据加权路径长度通过孤立森林算法获得异常数据点并对环境空气质量进行检测,提高了异常数据点的检测准确性以及环境质量的评估准确性。
专利主权项内容
1.一种环境空气自动监测过程中异常数据处理方法,其特征在于,所述方法包括以下步骤:获取监测环境空气的环境变化特征序列;根据孤立森林算法构建所述环境变化特征序列中数据点的孤立树模型;根据数据点在所述孤立树模型中的任意叶节点所对应的父节点的孤立树结构特征获得数据点的路径子权重值;根据数据点的所述路径子权重值获得路径权重值;根据所述路径权重值划分标记数据点和常规数据点;在所述环境变化特征序列中根据所述标记数据点的预设关联范围内其他数据点的波动特征获得权重可信度;根据所述权重可信度对标记数据点的路径权重值进行修正获得修正路径权重值;根据所述常规数据点的路径权重值和所述标记数据点的修正路径权重值获得加权路径长度;根据所述加权路径长度通过孤立森林算法获得异常数据点;根据异常数据点对环境空气质量进行检测;所述根据数据点在所述孤立树模型中的任意叶节点所对应的父节点的孤立树结构特征获得数据点的路径子权重值的步骤包括:计算所述任意叶节点所对应的父节点包含的叶节点与所述父节点所在孤立树内包含的叶节点的数量比值,获得所述数据点的路径子权重值;所述根据数据点的所述路径子权重值获得路径权重值的步骤包括:计算所述数据点在所有孤立树的所述路径子权重值的平均值,获得所述数据点的路径权重值;所述根据所述路径权重值划分标记数据点和常规数据点的步骤包括:当数据点的所述路径权重值超过预设权重阈值时,所述数据点为所述标记数据点,否则为所述常规数据点;所述在所述环境变化特征序列中根据所述标记数据点的预设关联范围内其他数据点的波动特征获得权重可信度的步骤包括:在所述环境变化特征序列中的任意环境特征下计算所述标记数据点的预设关联范围内其他数据点的方差,获得标记数据点的子可信度;计算标记数据点在所有环境特征下的所述子可信度的平均值,获得所述标记数据点的权重可信度;所述根据所述权重可信度对标记数据点的路径权重值进行修正获得修正路径权重值的步骤包括:当标记数据点的权重可信度超过预设可信阈值时,将所述标记数据点的路径权重值作为所述标记数据点的修正路径权重值;当标记数据点的权重可信度不超过预设可信阈值时,将所述预设权重阈值作为所述标记数据点的修正路径权重值;所述根据所述常规数据点的路径权重值和所述标记数据点的修正路径权重值获得加权路径长度的步骤包括:根据所述孤立树模型分别获得常规数据点和标记数据点的平均路径长度;计算预设第一常数与常规数据点的所述路径权重值的差值,获得常规数据点的权重系数;计算所述权重系数与所述常规数据点的平均路径长度的乘积;获得常规数据点的所述加权路径长度;计算预设第一常数与标记数据点的所述修正路径权重值的差值,获得标记数据点的修正权重系数;计算所述修正权重系数与所述标记数据点的平均路径长度的乘积,获得标记数据点的所述加权路径长度。 马 克 数 据 网