一种基于大数据的数据筛选方法及系统
摘要文本
本申请公开了一种基于大数据的数据筛选方法及系统,采用了技术的手段,在接收到第一数据获取请求时,无论与数据源的连接情况与否,都能够得到与第一数据获取请求匹配的可展示页面,以满足数据获取方的数据展示需求,有利于提高数据获取方的体验。一方面,通过以管理、监督目的的数据处理,实现了基于大数据的数据筛选。另一方面,为进一步地减少监督、管理资源的消耗提供了条件。
申请人信息
- 申请人:中国标准化研究院
- 申请人地址:100191 北京市海淀区知春路4号
- 发明人: 中国标准化研究院
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种基于大数据的数据筛选方法及系统 |
| 专利类型 | 发明申请 |
| 申请号 | CN202311620620.0 |
| 申请日 | 2023/11/30 |
| 公告号 | CN117555951A |
| 公开日 | 2024/2/13 |
| IPC主分类号 | G06F16/248 |
| 权利人 | 中国标准化研究院 |
| 发明人 | 徐凯程; 李文武; 王志强; 岳高峰 |
| 地址 | 北京市海淀区知春路4号 |
专利主权项内容
1.一种基于大数据的数据筛选方法,其特征在于,所述方法包括:在接收到数据获取方的第一数据获取请求时,获取为各备选CDN节点进行排序得到的节点序列;所述节点序列中任意相邻的两个备选CDN节点在距当前时刻的第一历史时间段内最大访问量的用户群体的用户画像之间的差异大于预设的差异阈值;并且,在所述节点序列中,任意一个所述备选CDN节点在距当前时刻的第二历史时间段内的访问量大于预设的访问量阈值;从待展示页面的各信息展示位中,确定出第一展示位;所述第一展示位是所述待展示页面中位于前列的信息展示位,且所述第一展示位之间间隔有第二展示位;依次按照所述节点序列中所述备选CDN节点的顺序,从所述备选CDN节点本地存储的数据中,确定出与所述第一数据获取请求匹配度最高的,添加至所述第一展示位中;依次按照所述节点序列中所述备选CDN节点的顺序,从所述备选CDN节点本地存储的数据中,确定出与所述第一数据获取请求匹配度大于预设的匹配度阈值的,作为备选数据;对所述备选数据进行分组,得到数据组;使得任一个所述数据组中的数据来源于不同的所述备选CDN节点,并且,同一个所述数据组中的数据对应于相同的数据描述对象;对同一所述数据组中的数据进行整合,得到整合数据;所述整合数据包含若干个字段,所述字段包含所述数据组的数据中出现频率最高的字段、以及所述数据组的数据之间相似度最低的字段;将所述整合数据添加至所述第二展示位中,得到可展示页面;展示所述可展示页面。