基于AI大模型的网络恶意写手识别方法及系统
申请人信息
- 申请人:青岛国实科技集团有限公司
- 申请人地址:266000 山东省青岛市即墨市凤凰路以西、创业路以南
- 发明人: 青岛国实科技集团有限公司
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 基于AI大模型的网络恶意写手识别方法及系统 |
| 专利类型 | 发明申请 |
| 申请号 | CN202410160652.5 |
| 申请日 | 2024/2/5 |
| 公告号 | CN117743698A |
| 公开日 | 2024/3/22 |
| IPC主分类号 | G06F16/9536 |
| 权利人 | 青岛国实科技集团有限公司 |
| 发明人 | 陈溟; 杨帅; 苏亮; 贾晓艺; 王丹阳; 李志勇; 戴维巍; 王成锐; 林青霞; 黄笑晗; 付艳; 张嘉树 |
| 地址 | 山东省青岛市即墨市凤凰路以西、创业路以南 |
摘要文本
本申请涉及数据处理技术领域,特别是涉及基于AI大模型的网络恶意写手识别方法及系统。其中,该方法包括:确定网络写手的识别要素,根据识别要素进行数据采集并构建写手识别数据集;基于AI大模型及QT‑LoRA模型构建写手识别模型,在超算平台基于所述识别数据集对所述QT‑LoRA模型进行分布式并行训练,基于训练后的QT‑LoRA模型与AI大模型的预训练模型合并,生成全量模型权重文件,使AI大模型适用于写手识别任务,接入待识别社交平台的用户信息、评论信息,调用所述AI大模型进行批量网络写手识别。通过本申请,显著提升了网络写手识别效率与准确率,降低了成本。
专利主权项内容
1.一种基于AI大模型的网络恶意写手识别方法,其特征在于,包括:数据集获取步骤,确定网络写手的识别要素,根据识别要素进行数据采集并构建写手识别数据集,所述识别要素包括:用户IP特征、用户属性特征、用户关系特征、用户评论内容特征、用户周期特征,所述识别数据集包括识别数据子集、评论数据子集;识别模型构建步骤,基于AI大模型及QT-LoRA模型构建写手识别模型,所述QT-LoRA模型包括依次配置的第一Linear线性模块、自注意力机制模块Self-Attention、第二Linear线性模块及前馈全连接层Feed-Forward,所述第一Linear线性模块、第二Linear线性模块均前置有双量化模块且后置有Adapter模块,所述双量化模块用于对常量进行二次量化;识别模型训练步骤,在超算平台基于所述识别数据集对所述QT-LoRA模型进行分布式并行训练,基于训练后的QT-LoRA模型与AI大模型的预训练模型合并,生成全量模型权重文件,使AI大模型适用于写手识别任务;网络写手识别步骤,接入待识别社交平台的用户信息、评论信息,调用所述AI大模型进行批量网络写手识别。。来源:马 克 团 队