← 返回列表

基于话题表示与多维特征嵌入的群体行为预测方法

申请号: CN202311179820.7
申请人: 广州大学
更新日期: 2026-03-09

专利详细信息

项目 内容
专利名称 基于话题表示与多维特征嵌入的群体行为预测方法
专利类型 发明申请
申请号 CN202311179820.7
申请日 2023/9/13
公告号 CN117454143A
公开日 2024/1/26
IPC主分类号 G06F18/213
权利人 广州大学
发明人 李树栋; 黄小慧; 吴晓波; 韩伟红; 黄兹勤; 陈昭阳; 李雪斌; 杨鹏伟; 唐可可; 张登辉
地址 广东省广州市番禺区大学城外环西路230号

摘要文本

广州大学获取“一种透气窗帘布”专利技术,本发明公开了一种基于话题表示与多维特征嵌入的群体行为预测方法,具体为:S1话题表示:通过N‑gram模型获取话题中文本的词项序列,通过TF‑IDF评估词项序列中词项的重要程度来构建保留词典,将词典与LDA主题模型的主题分析结果进行对比,形成词项序列集,从而有效地表示及区分话题,提升行为预测的准确率。S2特征表示与融合:对用户行为设置权重,根据用户间的联系程度设置衡量因子,最后为用户间的连接边设置综合权重,以此重构话题消息传播网络,再采用Node2vec算法获取节点的嵌入向量表示得到网络结构特征向量。S3、构建群体行为预测模型:基于混合深度神经网络模型,学习和表示词项序列集,将属性和结构两个维度的特征作为嵌入特征,实现用户群体行为的预测。

专利主权项内容

1.基于话题表示与多维特征嵌入的群体行为预测方法,其特征在于,包括下述步骤:S1、话题表示:采用N-gram模型对话题中的文本进行处理,得到词项序列;采用TF-IDF来评估词项序列中每个词项的重要程度,过滤词项序列中重要程度较低的词项,并选择重要程度高的词项来构建保留词典;利用LDA主题模型对话题文本进行主题分析,将分析结果与词典进行匹配,得到词项序列集;S2、特征表示与融合:采用不同的特征提取方法对用户属性进行特征提取,得到用户属性特征向量;综合考虑用户的行为类别和用户之间的互动频率,设置用户间连接边的权重来重构话题消息传播网络,获取用户节点的出入度值以及节点重要性,并采用Node2vec算法获取节点的嵌入向量表示,得到网络结构特征向量;采用特征融合方法将用户属性特征向量和网络结构特征向量进行融合,得到融合特征;S3、构建群体行为预测模型:群体行为预测模型为具有两个输入层的混合深度神经网络模型,其中一个输入层用于输入词项序列集,经过Glove嵌入层和两个长短期记忆网络层后输出至特征连接层;另一个输入层用于输入融合特征,输出至特征连接层后经过多个全连接层实现对群体行为的预测。