← 返回列表
一种数据自动分类的方法、装置、设备及存储介质
申请人信息
- 申请人:伟金投资有限公司
- 申请人地址:510630 广东省广州市天河区燕岭路120号502A01房
- 发明人: 伟金投资有限公司
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种数据自动分类的方法、装置、设备及存储介质 |
| 专利类型 | 发明申请 |
| 申请号 | CN202410017934.X |
| 申请日 | 2024/1/4 |
| 公告号 | CN117786119A |
| 公开日 | 2024/3/29 |
| IPC主分类号 | G06F16/35 |
| 权利人 | 伟金投资有限公司 |
| 发明人 | 黄智坤 |
| 地址 | 广东省广州市天河区燕岭路120号502A01房 |
摘要文本
本申请提供一种数据自动分类的方法、装置、设备及存储介质,涉及自然语言处理技术领域。方法包括:获取目标新闻中的关键词,并根据所述关键词,初步确定所述目标新闻的所属行业;获取所述目标新闻的文本内容中的实体词汇,并根据所述实体词汇,确定所述目标新闻对应的主题;统计所述目标新闻的文本内容中出现次数超过预设次数的高频词汇,并根据所述高频词汇,生成所述目标新闻的相关词汇;结合所述目标新闻的所属行业、所述目标新闻对应的主题和所述相关词汇,确定所述目标新闻的最终所述行业。本申请具有的技术效果是:用于提高新闻文本分类的准确率。
专利主权项内容
1.一种数据自动分类的方法,其特征在于,所述方法包括:获取目标新闻中的关键词,并根据所述关键词,确定所述目标新闻的第一所属行业;获取所述目标新闻的文本内容中的实体词汇,并根据所述实体词汇,确定所述目标新闻对应的主题;统计所述目标新闻的文本内容中出现次数超过预设次数的高频词汇,并根据所述高频词汇,生成所述目标新闻的相关词汇,并根据所述相关词汇,确定所述目标新闻的次级主题;结合所述目标新闻的第一所属行业、所述目标新闻对应的主题及所述目标新闻的次级主题,确定所述目标新闻的最终所属行业。