← 返回列表

一种网络信息平台中异常用户检测方法及系统

申请号: CN202410004159.4
申请人: 中国海洋大学
更新日期: 2026-03-16

专利详细信息

项目 内容
专利名称 一种网络信息平台中异常用户检测方法及系统
专利类型 发明授权
申请号 CN202410004159.4
申请日 2024/1/3
公告号 CN117520995B
公开日 2024/4/2
IPC主分类号 G06F18/2433
权利人 中国海洋大学
发明人 于彦伟; 陈怡辛; 齐建鹏; 董军宇
地址 山东省青岛市崂山区松岭路238号

摘要文本

本发明公开了一种网络信息平台中异常用户检测方法及系统,属于人工智能技术领域。本发明在进行社交网络中的异常用户检测时同时考虑了节点异质性以及正常用户和异常用户的结构分布差异两方面,具体表现为:利用连边上两个节点的特征向量计算连边类型及注意力分数,从而设计了一种直接针对于异常节点检测的聚合策略;然后利用正常用户和异常用户的结构分布差异构造了针对异常用户检测的实例对进行对比学习,使得具有同质连接的节点更加相似,具有异质连接的节点更加不相似。本发明能够实现有效的异常用户检测,用以防范欺诈行为,进而避免经济财产损失。

专利主权项内容

1.一种网络信息平台中异常用户检测方法,其特征在于,包括如下步骤:S1:收集网络信息平台数据,构建用户属性网络;将网络信息平台中的用户信息建模为属性网络G={V, ε, A, X},其中V={v, v, …, v}表示节点的集合,n表示节点的数量;ε∈{ε, ε}表示边的集合,其中ε表示同质边,ε表示异质边;表示邻接矩阵,当A=1时表示v节点和v节点间存在一条边;/>表示特征矩阵,每个节点v的特征向量是x,其维度是d;将网络信息平台中的每个用户看作属性网络中的一个节点,用属性网络中节点的特征向量表示每个用户各自带有的属性,用户与用户之间的交互看作是属性网络中的连边;所述同质边即连接该边的两个节点同为正常节点或异常节点,异质边即连接该边的两个节点一个是正常节点,另一个是异常节点;将异常节点作为正样本,正常节点作为负样本,即异常节点的标签为1,正常节点的标签为0,用户的属性包括用户的性别、年龄段、家庭住址、职业;12n+-+-ijijiiS2:计算边的连接类型,判断属于同质边或异质边,具体为:S2-1:对于每条e∈ε的边,通过连接该条边的两个节点的特征向量计算该条边的类型;表示第l层节点嵌入向量的集合,/>表示第i个节点的嵌入向量,d表示第l层嵌入向量的维度,H=X;对于第l个卷积层,首先通过公式(1)(2)对上一层节点的嵌入向量进行线性变换:uvl0其中,和/>分别是节点u和v在(l-1)层的嵌入向量,/>是可学习的参数矩阵;S2-2:利用变换后的嵌入向量的连接值和插值作为该边上的信息,具体实现过程如公式(3)所示:其中,表示可学习的参数矩阵,[.||.]表示连接操作;S2-3:通过公式(4)取出的符号作为该条边的类型:如果则e∈ε,即e是一条同质边;如果/>则e∈ε,即e是一条异质边;uv+uvuv-uvS3:基于连边类型计算源节点和目的节点的注意力分数,再利用图卷积神经网络GCN对邻接矩阵A进行卷积运算,聚合邻居节点的特征向量;所述S3具体包括:S3-1:通过S2得到每条边的连接类型后,按照公式(5)利用每条边的连接类型和S2中线性变换后的嵌入向量与/>计算源节点u对目的节点v的注意力分数:其中,是一个可学习的权重矩阵,LeakyReLU(·)是一个激活函数;S3-2:利用公式(6)对具有不同注意力分数和连接类型的源节点进行聚合,以得到目标节点的嵌入向量:其中,N(v)表示目标节点v的邻居节点的集合;S4:引入对比学习设计损失函数,利用数据集进行模型训练;所述S4具体包括:S4-1:将数据集按40%、30%和40%的比例划分为训练集、验证集和测试集;S4-2:引入对比学习:对每个节点构造一个实例对D=(v, p, Q),其中v是目标节点,p是正样本,是负样本的集合;对于一个节点,其正样本为邻居节点中具有同质连接的节点,负样本为邻居节点中具有异质连接的节点;为每个节点构造实例对后,使用InfoNCE函数公式(7)计算损失函数,使当损失函数最低时,目标节点与正样本节点更相似,而与负样本节点差异更大;iiiiiiS4-3:为解决样本不平衡问题,使用公式(8)的Focal loss损失函数来优化模型:其中,γ是调制系数,为常数,α是正负样本的权重,为常数,p表示预测结果;tS4-4:对于边类型的计算结果,使用有监督学习的方法进行优化;利用公式(9)的损失函数计算边类型损失:其中,ε表示边集,y表示对应边的类型,如果u和v的标签相同,则y=1,e是同质边;否则y=-1,e是异质边;tuvuvuvuvuvS4-5:模型的整体损失函数如下:其中,γ和γ是平衡参数,L表示模型的层数;12S5:检测异常用户;将待测数据集输入到训练好的模型中,输出异常用户数据。