← 返回列表

基于马尔科夫随机场的社交网络用户约束聚类方法及系统

申请号: CN202410059730.2
申请人: 东北师范大学
申请日期: 2024/1/16

摘要文本

本发明涉及数据处理领域,公开了基于马尔科夫随机场的社交网络用户约束聚类方法及系统,包括:随机选择一个数据点作为广度优先搜索的起点,将除起点外其余各数据点,属于各标签的概率初始化为1/K;对于广度优先搜索每次访问的数据点,使用其邻域内已访问的数据点来计算该数据点的属于各个标签的概率;顺序遍历所有的数据点,使用正在访问的数据点的邻域内的所有的数据点来计算该数据点概率,每轮遍历统计概率更新了的数据点的个数,若没有数据点更新概率,则迭代结束;遍历所有的标注,得到标注属于must‑link的概率。本发明使用马尔科夫随机场进行聚类,可以得到每个用户属于各个标签的概率,并且可以找出标注错误。

专利详细信息

项目 内容
专利名称 基于马尔科夫随机场的社交网络用户约束聚类方法及系统
专利类型 发明申请
申请号 CN202410059730.2
申请日 2024/1/16
公告号 CN117574189A
公开日 2024/2/20
IPC主分类号 G06F18/2321
权利人 东北师范大学
发明人 马万里; 高健
地址 吉林省长春市人民大街5268号

专利主权项内容

1.基于马尔科夫随机场的社交网络用户约束聚类方法,其特征在于,包括如下步骤:步骤一,根据采集的用户数据点,随机选择一个数据点作为广度优先搜索的起点,将随机选择的这个数据点随机赋给一个标签,将标签的概率赋值为1;将除起点外其余各数据点,属于各标签的概率初始化为1/K,其中K表示要划分为的簇的数量;设置visited数组并初始化为False;对于广度优先搜索每次访问的数据点,将其在visited数组中设置为True,并使用其邻域内已访问的数据点来计算该数据点的属于各个标签的概率;步骤二,顺序遍历所有的数据点,使用正在访问的数据点的邻域内的所有的数据点来计算该数据点概率,每轮遍历统计概率更新了的数据点的个数,若没有数据点更新概率,则迭代结束,得到所有数据点属于不同标签的概率;步骤三,遍历所有的标签,两端实例点属于同一标签的概率相乘再累加得到must-link的概率,根据标注属于must-link的概率得到标注属于cannot-link的概率,若标注属于must-link的概率大于标注属于cannot-link的概率,而标注为cannot-link,则判断标注错误;若标注属于cannot-link的概率大于标注属于must-link的概率,而标注为must-link,则判断标注错误。