← 返回列表

一种新闻文本分类方法

申请号: CN202410189847.2
申请人: 广东海洋大学
更新日期: 2026-03-17

专利详细信息

项目 内容
专利名称 一种新闻文本分类方法
专利类型 发明申请
申请号 CN202410189847.2
申请日 2024/2/20
公告号 CN117743585A
公开日 2024/3/22
IPC主分类号 G06F16/35
权利人 广东海洋大学
发明人 冯卓文; 王观承; 王颢静; 徐广珺
地址 广东省湛江市麻章区海大路1号

摘要文本

本发明公开了一种新闻文本分类方法,属于数据处理技术领域,包括以下步骤:S1、根据新闻文本的标题和首段文本内容,生成标题与首段文本内容之间的第一内容关联权重;S2、根据新闻文本的标题、末段文本内容以及第一内容关联权重,生成标题与末段文本内容之间的第二内容关联权重;S3、根据新闻文本中除首段文本内容和末段文本内容外其余文本内容,生成第三内容关联权重;S4、构建文本处理模型,将第一内容关联权重、第二内容关联权重以及第三内容关键权重输入至文本处理模型中,得到新闻文本的分类结果。整个分类过程把握新闻文本整体内容结构,充分考虑关键词的影响,分类结果的误差小,准确率高。

专利主权项内容

1.一种新闻文本分类方法,其特征在于,包括以下步骤:S1、根据新闻文本的标题和首段文本内容,生成标题与首段文本内容之间的第一内容关联权重;S2、根据新闻文本的标题、末段文本内容以及第一内容关联权重,生成标题与末段文本内容之间的第二内容关联权重;S3、根据新闻文本中除首段文本内容和末段文本内容外其余文本内容,生成第三内容关联权重;S4、构建文本处理模型,将第一内容关联权重、第二内容关联权重以及第三内容关键权重输入至文本处理模型中,得到新闻文本的分类结果。