← 返回列表

一种数据自动分类的方法、装置、设备及存储介质

申请号: CN202410017934.X
申请人: 伟金投资有限公司
更新日期: 2026-03-17

专利详细信息

项目 内容
专利名称 一种数据自动分类的方法、装置、设备及存储介质
专利类型 发明申请
申请号 CN202410017934.X
申请日 2024/1/4
公告号 CN117786119A
公开日 2024/3/29
IPC主分类号 G06F16/35
权利人 伟金投资有限公司
发明人 黄智坤
地址 广东省广州市天河区燕岭路120号502A01房

摘要文本

本申请提供一种数据自动分类的方法、装置、设备及存储介质,涉及自然语言处理技术领域。方法包括:获取目标新闻中的关键词,并根据所述关键词,初步确定所述目标新闻的所属行业;获取所述目标新闻的文本内容中的实体词汇,并根据所述实体词汇,确定所述目标新闻对应的主题;统计所述目标新闻的文本内容中出现次数超过预设次数的高频词汇,并根据所述高频词汇,生成所述目标新闻的相关词汇;结合所述目标新闻的所属行业、所述目标新闻对应的主题和所述相关词汇,确定所述目标新闻的最终所述行业。本申请具有的技术效果是:用于提高新闻文本分类的准确率。

专利主权项内容

1.一种数据自动分类的方法,其特征在于,所述方法包括:获取目标新闻中的关键词,并根据所述关键词,确定所述目标新闻的第一所属行业;获取所述目标新闻的文本内容中的实体词汇,并根据所述实体词汇,确定所述目标新闻对应的主题;统计所述目标新闻的文本内容中出现次数超过预设次数的高频词汇,并根据所述高频词汇,生成所述目标新闻的相关词汇,并根据所述相关词汇,确定所述目标新闻的次级主题;结合所述目标新闻的第一所属行业、所述目标新闻对应的主题及所述目标新闻的次级主题,确定所述目标新闻的最终所属行业。