← 返回列表

一种数据分析方法、装置及系统

申请号: CN202410051642.8
申请人: 河北网新数字技术股份有限公司
更新日期: 2026-03-20

专利详细信息

项目 内容
专利名称 一种数据分析方法、装置及系统
专利类型 发明申请
申请号 CN202410051642.8
申请日 2024/1/15
公告号 CN117574243A
公开日 2024/2/20
IPC主分类号 G06F18/241
权利人 河北网新数字技术股份有限公司
发明人 闫荣新; 孟凡华; 谷莉方
地址 河北省石家庄市鹿泉经济开发区瑞宁路9号

摘要文本

本发明公开一种数据分析方法、装置及系统,涉及数据处理领域。本发明包括,获取对数据进行分类的种类;获取每个种类的数据仓;获取每个所述数据仓的参考数据;获取未分类数据;根据所述数据仓内已分类数据的数据特性以及对应的所述参考数据的数据特征得到所述数据仓的数据特征;获取并根据未分类数据的数据特征以及每个所述数据仓的数据特征得到每个已分类数据的种类。本发明通过对未分类的数据与每个总类的参考数据进行匹配分析,实现了对数据的准确分类。

专利主权项内容

1.一种数据分析方法,其特征在于,包括,获取对数据进行分类的种类;获取每个种类的数据仓;获取每个所述数据仓的参考数据;获取未分类数据;根据所述数据仓内已分类数据的数据特性以及对应的所述参考数据的数据特征得到所述数据仓的数据特征;获取并根据未分类数据的数据特征以及每个所述数据仓的数据特征得到每个已分类数据的种类;其中,所述根据所述数据仓内已分类数据的数据特性以及对应的所述参考数据的数据特征得到所述数据仓的数据特征的步骤包括,对每个所述参考数据进行词语分割,得到每个所述参考数据内的分割词以及对应的数量;根据每个所述参考数据内的分割词以及对应的数量得到每个所述参考数据内关键词及其词频;将每个所述数据仓对应的所述参考数据的所述关键词作为所述数据仓内已分类数据的关键词;对每个所述数据仓内已分类数据进行词语分割,得到每个所述数据仓内每个已分类数据的关键词的词频;根据每个所述参考数据内关键词及其词频以及每个所述数据仓内每个已分类数据的关键词的词频得到所述数据仓内已分类数据中每个关键词的词频有效分布范围作为所述数据仓的数据特征。