← 返回列表
一种基于大语言模型的钓鱼邮件检测方法
摘要文本
本发明提供一种基于大语言模型的钓鱼邮件检测方法,属于人工智能技术领域,大语言模型不需要进行复杂的特征工程,将写有待测邮件的提示模板输入大语言模型,大语言模型就可以直接处理邮件内容,最后由大语言模型判断待测邮件是否为钓鱼邮件;而且,大语言模型具有出色的语义理解能力,可以深入识别和理解邮件的上下文内容,从而更准确地识别钓鱼邮件中应用的社会工程学技术和心理操纵技巧;此外,大语言模型具有强大的多语言处理能力,可以解决语言障碍问题,为其他语言的钓鱼邮件检测提供新的研究思路;最后,本发明同时使用没有开源的和开源的大语言模型进行钓鱼邮件检测,能够更好地研究开源大语言模型检测钓鱼邮件的性能和探索社会工程学领域的垂直大模型构建。 数据由马 克 团 队整理
申请人信息
- 申请人:北京邮电大学
- 申请人地址:100088 北京市海淀区西土城路10号
- 发明人: 北京邮电大学
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种基于大语言模型的钓鱼邮件检测方法 |
| 专利类型 | 发明申请 |
| 申请号 | CN202410095168.9 |
| 申请日 | 2024/1/24 |
| 公告号 | CN117614748A |
| 公开日 | 2024/2/27 |
| IPC主分类号 | H04L9/40 |
| 权利人 | 北京邮电大学 |
| 发明人 | 伍淳华; 郑康锋; 张尚; 武斌 |
| 地址 | 北京市海淀区西土城路10号 |
专利主权项内容
1.一种基于大语言模型的钓鱼邮件检测方法,其特征在于,包括以下步骤:将待测邮件进行预处理,使得待测邮件的长度控制在设定范围内;将预处理后的待测邮件写入设定的提示模板中,其中,所述提示模板包括问题部分和邮件部分,且邮件部分用于写入预处理后的待测邮件,问题部分设置为:分析邮件的可疑因素以及是否包含社会工程学技术、分析邮件的URL、识别邮件意图、给出邮件是否为钓鱼邮件的结论及理由、以JSON格式输出判断结果;将写有预处理后的待测邮件的提示模板输入大语言模型,由大语言模型判断待测邮件是否为钓鱼邮件,其中,大语言模型为GPT-4、GPT-3.5或者开源大语言模型Llama2、BaiChuan2、ChatGLM2。