← 返回列表

一种基于位图查询用户留存的数据处理方法

申请号: CN202311737605.4
申请人: 云筑信息科技(成都)有限公司
申请日期: 2023/12/18

摘要文本

本发明公开了一种基于位图查询用户留存的数据处理方法,所述方法通过将用户id进行编码转化为整数和位图,生成存储有每天活跃用户的日活跃用户位图表,当用户自定义时间范围、留存周期和留存粒度时,根据以上自定义信息从日活跃用户位图表对位图求并集、交集和位图基数,得到留存用户数及用户留存率。本发明解决了现有调度系统预聚合方式不能自定义留存周期和留存粒度的弊端,并且采用位图存储大大降低了数据存储空间,提高了查询效率。

专利详细信息

项目 内容
专利名称 一种基于位图查询用户留存的数据处理方法
专利类型 发明授权
申请号 CN202311737605.4
申请日 2023/12/18
公告号 CN117435756B
公开日 2024/3/26
IPC主分类号 G06F16/51
权利人 云筑信息科技(成都)有限公司
发明人 向才锋; 陶赵文; 张自平; 刘毅强
地址 四川省成都市高新区天府二街151号1栋1单元36层

专利主权项内容

1.一种基于位图查询用户留存的数据处理方法,其特征在于,包括以下步骤:步骤1、创建一个以天为维度的日活跃用户表,将每天活跃的用户id写入日活跃用户表对应天之后;步骤2、将每个用户id编码为唯一的整数,将整数转换为位图;步骤3、创建一个以天为维度的日活跃用户位图表,将每天活跃的所有用户id的位图合并为一个第一位图,将第一位图写入日活跃用户位图表对应天之后;步骤4、根据设定的查询时间、留存粒度和留存周期确定待计算的时间,提取日活跃用户位图表中待计算的时间内的天和对应第一位图,得到第一数据集;步骤5、根据设定的留存粒度和留存周期,将待计算的时间分为不同的时间段,将每个时间段下的所有第一位图合并为一个第二位图,创建包含每个时间段和对应第二位图的第二数据集;步骤6、在第二数据集每个时间段的第二位图后添加相邻下一时间段的第二位图,得到第三数据集;步骤7、计算每个时间段的第二位图和相邻下一时间段的第二位图的交集,得到用户留存位图,将用户留存位图写入第三数据集中,得到第四数据集;步骤8、基于每个时间段的第二位图和用户留存位图得到每个时间段的活跃用户数和下一时间段的留存用户数,由活跃用户数和留存用户数得到用户留存率。