一种基于对抗生成shapelet的流量异常检测方法及系统
摘要文本
本发明公开了一种基于对抗生成shapelet的流量异常检测方法及系统,方法包括:判断至少一个流量数据时间序列的时间长度是否大于第一预设阈值;若大于第一预设阈值,则采用两个一维卷积层和一个平均池化层生成shapelet序列;基于判别器对shapelet序列与流量数据时间序列进行辨识,并添加对抗损失训练shapelet序列和流量数据时间序列,使生成的shapelet序列与流量数据时间序列的形状相差不大于第二预设阈值;计算训练后的shapelet序列和流量数据时间序列之间的DTW值,并根据DTW值将流量数据时间序列转化为基于shapelet序列的特征向量,与KNN分类器结合,输出流量异常检测结果。能够提高了流量异常检测的效率。
申请人信息
- 申请人:南昌科晨电力试验研究有限公司; 国网江西省电力有限公司电力科学研究院
- 申请人地址:330000 江西省南昌市青山湖区民营科技园内民强路88号
- 发明人: 南昌科晨电力试验研究有限公司; 国网江西省电力有限公司电力科学研究院
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种基于对抗生成shapelet的流量异常检测方法及系统 |
| 专利类型 | 发明申请 |
| 申请号 | CN202311695002.2 |
| 申请日 | 2023/12/12 |
| 公告号 | CN117407733A |
| 公开日 | 2024/1/16 |
| IPC主分类号 | G06F18/23 |
| 权利人 | 南昌科晨电力试验研究有限公司; 国网江西省电力有限公司电力科学研究院 |
| 发明人 | 肖勇才; 杨柳; 喻思; 杨浩; 徐健; 刘旷也; 章玲玲; 姚保明; 蔡庆; 喻宝禄; 兰鑫; 黎书适; 余存智; 杜江龙 |
| 地址 | 江西省南昌市青山湖区民营科技园内民强路88号; 江西省南昌市青山湖区民营科技园内民强路88号 |
专利主权项内容
1.一种基于对抗生成shapelet的流量异常检测方法,其特征在于,包括:抓取流量数据,并将所述流量数据转换为CSV文件,其中,所述CSV文件中包含基于时间排序的至少一个流量数据时间序列;判断所述至少一个流量数据时间序列的时间长度是否大于第一预设阈值;若不大于第一预设阈值,则设是N个流量数据时间序列的集合,假设/>中流量数据时间序列具有长度/>,/>中的第i个流量数据时间序列/>由/>个元素组成:,i=1,…,N;随机选取一个流量数据时间序列作为第一个聚类中心;计算每个流量数据时间序列与当前已有类聚中心最短欧式距离D(x),其中,D(x)的表达式为:
,
,式中,为除聚类中心以外的任何一个流量数据时间序列,/>为第一个流量数据时间序列中的第一个元素,/>为第一个流量数据时间序列中的第二个元素,/>为第一个流量数据时间序列中的第三个元素,/>为第一个流量数据时间序列中的第n个元素,/>为第二个流量数据时间序列中的第一个元素,/>为第二个流量数据时间序列中的第二个元素,为第二个流量数据时间序列中的第三个元素,/>为第三个流量数据时间序列中的第n个元素;计算每个流量数据时间序列被选为下一个聚类中心的概率,直至选出K个聚类中心为/>,/>为所有元素的全部范围;根据k-means算法计算每个流量数据时间序列所属的聚类类别,其中,计算每个流量数据时间序列所属的聚类类别的表达式为:
,式中,为第i个聚类类别,/>为标记符号,/>为第i个流量数据时间序列,/>为第K个聚类中心,/>为计算函数;其中,,式中,表示第i个流量数据时间序列被归类到第K个聚类中心时为1,否则为0;将流量数据时间序列的突变点作为特殊点,从使用特殊点作为端点的原始子序列中提取shapelet序列,其中,特殊点为流量数据时间序列的峰值点,即h=argmax(f(x))和l=argminx(f(x));其中,f(x)表示流量数据时间序列的函数表达式,argmax表示取最大值时的自变量x的值,argmin表示取最小值时的自变量x的值;若大于第一预设阈值,则采用预设的shapelet生成器根据预设长度的滑动窗口提取所述CSV文件中某一流量数据时间序列的至少一个原始子序列,将所述至少一个原始子序列进行拼接,并经过一维卷积层和平均池化层运算后得到至少一个shapelet序列;基于判别器对所述至少一个shapelet序列与所述至少一个流量数据时间序列进行辨识,并添加对抗损失训练所述至少一个shapelet序列和所述至少一个流量数据时间序列,使生成的所述至少一个shapelet序列与所述至少一个流量数据时间序列的形状相差不大于第二预设阈值;计算训练后的所述至少一个shapelet序列和所述至少一个流量数据时间序列之间的DTW值,并根据所述DTW值将所述至少一个流量数据时间序列转化为基于shapelet序列的至少一个特征向量,与KNN分类器结合,输出流量异常检测结果。