← 返回列表

一种基于知识增强神经网络模型的讽刺检测方法及系统

申请号: CN202311374400.4
申请人: 广东外语外贸大学
更新日期: 2026-03-09

专利详细信息

项目 内容
专利名称 一种基于知识增强神经网络模型的讽刺检测方法及系统
专利类型 发明申请
申请号 CN202311374400.4
申请日 2023/10/23
公告号 CN117454873A
公开日 2024/1/26
IPC主分类号 G06F40/205
权利人 广东外语外贸大学
发明人 任亚峰; 王子霖
地址 广东省广州市白云区白云大道北2号

摘要文本

广东外语外贸大学获取“一种透气窗帘布”专利技术,本发明公开了一种基于知识增强神经网络模型的讽刺检测方法及系统,包括:S1.从外部知识源筛选与待检测文本高度相关的上下文信息并与原始文本进行整合;S2.使用预训练语言模型RoBERTa对整合后的文本数据进行词嵌入,并初始化双向长短时记忆BiLSTM网络的权值;S3.构建由8层双向长短时记忆BiLSTM网络组成的编码模型,在双向长短时记忆BiLSTM网络中嵌入多头自注意力机制,捕捉文本中的长距离依赖关系和局部语义特征;S4.分类训练并通过优化算法来改进模型,获得最终的知识增强讽刺检测模型;S5.采集待检测文本并输入知识增强讽刺检测模型,输出讽刺检测结果;本发明增强了模型对讽刺的理解,使模型能够有效捕获更复杂的语言模式,显著提高了讽刺检测的准确性和鲁棒性。 微信公众号马克 数据网

专利主权项内容

1.一种基于知识增强神经网络模型的讽刺检测方法,其特征在于,包括以下步骤:S1.从外部知识源筛选与待检测文本高度相关的上下文信息,并将筛选出的上下文信息与原始文本进行整合;S2.使用预训练语言模型RoBERTa对整合后的文本数据进行词嵌入,并初始化双向长短时记忆BiLSTM网络的权值;S3.构建由8层双向长短时记忆BiLSTM网络组成的编码模型,在双向长短时记忆BiLSTM网络中嵌入多头自注意力机制,捕捉文本中的长距离依赖关系和局部语义特征;S4.将预训练语言模型RoBERTa的词嵌入输入到编码模型中,通过全连接层和多头自注意力机制,以及由softmax激活函数构成的分类器进行多分类训练,并通过优化算法来改进模型,获得最终的知识增强讽刺检测模型;S5.采集待检测文本并输入知识增强讽刺检测模型,输出讽刺检测结果。