← 返回列表

一种用于流基数测量的数据处理结构及其应用

申请号: CN202410252742.7
申请人: 苏州元澄科技股份有限公司
更新日期: 2026-03-20

专利详细信息

项目 内容
专利名称 一种用于流基数测量的数据处理结构及其应用
专利类型 发明申请
申请号 CN202410252742.7
申请日 2024/3/6
公告号 CN117827851A
公开日 2024/4/5
IPC主分类号 G06F16/22
权利人 苏州元澄科技股份有限公司
发明人 高国举; 周少龙; 沈鸣飞; 赵柳淇
地址 江苏省苏州市姑苏区解放东路555号桐泾商务广场2幢1301室

摘要文本

本发明公开了一种用于流基数测量的数据处理结构及其应用,该数据处理结构包括:基数估计器,包括一个长度为M的位图;大流部分,用于记录基数大于设定阈值的流信息;小流部分,包括一个CM Sketch。本发明将多流的流式基数估计技术与通常运用在流频数测量中的大小流区分存储技术结合,做到了对大基数流的精确估计,对小基数流较为精确的估计,同时可以完成多种基数测量任务。并且为大流部分与小流部分设计了一个巧妙的交换过程,保证了大流部分的准确度,同时确保小流部分不会存储大基数流的基数信息,避免了小基数流与大基数流共享一个计数器时导致小基数的过高估计。

专利主权项内容

1.一种用于流基数测量的数据处理结构,其特征在于,包括:基数估计器,包括一个长度为M的位图;大流部分,用于记录基数大于设定阈值的流信息;小流部分,包括一个CM Sketch,所述CM Sketch的基本结构是一个行列的二维寄存器数组C,每一个寄存器作为一个计数器,C[][]表示第行第列的计数器;所述CMSketch的每一行关联一个哈希函数,1≤≤,会将流映射到第行第列的计数器;当向CM Sketch中插入一条大小为的流时,CM Sketch会将流映射到每一行的计数器C[][]增加;当查询流f的大小时,CM Sketch会报告流f映射到的个计数器中值最小的那个计数器的值。dwijijhiidhifihi(f)xffihi(f)xd