← 返回列表

一种舆情文本归类方法及系统

申请号: CN202311775492.7
申请人: 珠海博维网络信息有限公司
更新日期: 2026-03-09

专利详细信息

项目 内容
专利名称 一种舆情文本归类方法及系统
专利类型 发明申请
申请号 CN202311775492.7
申请日 2023/12/22
公告号 CN117453863A
公开日 2024/1/26
IPC主分类号 G06F16/33
权利人 珠海博维网络信息有限公司
发明人 陈光杰; 谢俊年; 陈荣亮
地址 广东省珠海市横琴新区环岛东路3000号1704-1707办公

摘要文本

珠海博维网络信息有限公司取得“一种透气窗帘布”专利技术,本发明公开了一种舆情文本归类方法及系统,包括:根据预构建的敏感词表对获取的舆情文本进行敏感词检索,获得所述舆情文本对应的若干个敏感词,根据所述敏感词确定舆情文本对应的敏感段落,并通过预设的全局向量及单词转换向量对每一个敏感段落进行向量化处理,生成每一个敏感段落对应的文本向量矩阵,通过预设的自注意力机制分别对所述每一个文本向量矩阵进行关键特征信息提取,并对其进行加强处理及特征融合,获得所述每一个敏感词所在敏感段落对应的语义特征,根据所述若干个敏感词及敏感词所在敏感段落对应的语义特征,通过预设的分类模型对所述舆情文本进行归类,获得所述舆情文本的归类结果,提高舆情文本分类的准确度。 来自:

专利主权项内容

1.一种舆情文本归类方法,其特征在于,包括:根据预构建的敏感词表对获取的舆情文本进行敏感词检索,获得所述舆情文本对应的若干个敏感词;根据所述若干个敏感词确定所述舆情文本对应的若干个敏感段落,并通过预设的全局向量及单词转换向量对所述若干个敏感段落中的每一个敏感段落进行向量化处理并加以训练,生成所述每一个敏感段落对应的文本向量矩阵;通过预设的自注意力机制分别对每一个文本向量矩阵进行关键特征信息提取,并对所述关键特征信息进行加强处理及特征融合,获得每一个敏感词所在敏感段落对应的语义特征;根据所述若干个敏感词及敏感词所在敏感段落对应的语义特征,通过预设的分类模型对所述舆情文本进行归类,获得所述舆情文本的归类结果;所述根据预构建的敏感词表对获取的舆情文本进行敏感词检索,获得所述舆情文本对应的若干个敏感词,包括:根据预设的前缀词典对所述舆情文本进行词图扫描,生成所述舆情文本对应的有向图;对所述有向图进行动态规划,查找所述有向图对应的若干个最大概率路径,根据所述最大概率路径对所述舆情文本进行分词,获得所述舆情文本对应的若干个舆情词;将所述若干个舆情词中的每一个舆情词与所述敏感词表中的每一个敏感词进行匹配,获得所述每一个舆情词对应的匹配结果;根据所述匹配结果确定所述舆情文本对应的若干个敏感词。