← 返回列表
一种新闻文本分类方法
申请人信息
- 申请人:广东海洋大学
- 申请人地址:524088 广东省湛江市麻章区海大路1号
- 发明人: 广东海洋大学
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种新闻文本分类方法 |
| 专利类型 | 发明申请 |
| 申请号 | CN202410189847.2 |
| 申请日 | 2024/2/20 |
| 公告号 | CN117743585A |
| 公开日 | 2024/3/22 |
| IPC主分类号 | G06F16/35 |
| 权利人 | 广东海洋大学 |
| 发明人 | 冯卓文; 王观承; 王颢静; 徐广珺 |
| 地址 | 广东省湛江市麻章区海大路1号 |
摘要文本
本发明公开了一种新闻文本分类方法,属于数据处理技术领域,包括以下步骤:S1、根据新闻文本的标题和首段文本内容,生成标题与首段文本内容之间的第一内容关联权重;S2、根据新闻文本的标题、末段文本内容以及第一内容关联权重,生成标题与末段文本内容之间的第二内容关联权重;S3、根据新闻文本中除首段文本内容和末段文本内容外其余文本内容,生成第三内容关联权重;S4、构建文本处理模型,将第一内容关联权重、第二内容关联权重以及第三内容关键权重输入至文本处理模型中,得到新闻文本的分类结果。整个分类过程把握新闻文本整体内容结构,充分考虑关键词的影响,分类结果的误差小,准确率高。
专利主权项内容
1.一种新闻文本分类方法,其特征在于,包括以下步骤:S1、根据新闻文本的标题和首段文本内容,生成标题与首段文本内容之间的第一内容关联权重;S2、根据新闻文本的标题、末段文本内容以及第一内容关联权重,生成标题与末段文本内容之间的第二内容关联权重;S3、根据新闻文本中除首段文本内容和末段文本内容外其余文本内容,生成第三内容关联权重;S4、构建文本处理模型,将第一内容关联权重、第二内容关联权重以及第三内容关键权重输入至文本处理模型中,得到新闻文本的分类结果。