一种手机APP定位异常数据检测方法及其装置
摘要文本
本发明提供一种手机APP定位异常数据检测方法及其装置,包括数据存储模块,判断模块、数据预处理模块、检测模块和清洗模块,及对应的检测方法。本发明通过提供一种高效、精准的方法,达到有效检测因APP刷量产生的手机APP定位异常数据的效果,有效保证数据的准确性。
申请人信息
- 申请人:同济大学; 上海同济城市规划设计研究院
- 申请人地址:200092 上海市杨浦区四平路1239号
- 发明人: 同济大学; 上海同济城市规划设计研究院
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种手机APP定位异常数据检测方法及其装置 |
| 专利类型 | 发明授权 |
| 申请号 | CN201710156463.0 |
| 申请日 | 2017年3月16日 |
| 公告号 | CN107071802B |
| 公开日 | 2024年2月27日 |
| IPC主分类号 | H04W24/02 |
| 权利人 | 同济大学; 上海同济城市规划设计研究院 |
| 发明人 | 王德; 殷振轩 |
| 地址 | 上海市杨浦区四平路1239号; 上海市杨浦区四平路1239号 |
专利主权项内容
1.一种手机APP定位异常数据检测方法,具体步骤如下:A.读取服务器中的用户定位数据,剔除时间戳和用户代码错误的数据;B.统计每个经纬度位置上的用户数量;C.以均值比方法从步骤B中的统计数据中找出异常点;D.根据置信区间和统计量众数,判断异常点是否真实;E.将步骤D中判断为用户数量数据不真实的异常点作为异常用户数量的起始处,将异常点以及排序在异常点之后的所有用户数量标记为异常用户数量,并找出这些异常用户数量对应的经纬度位置,删除在这些经纬度位置上记录用户的所有数据;在所述步骤C以均值比方法从步骤B中的统计数据中找出异常点,是将每个经纬度位置上记录的用户数量按从小到大排列,分别计算第一个至倒数第二个统计量的跳跃度其中,是期望点估计,n为统计量数量,跳跃度最大处为异常点;所述步骤D根据置信区间和统计量众数,判断异常点是否真实,是判断在置信区间1-α的条件下,异常点是否真实,并判断所述异常用户数量的起始点是否位于统计量的众数处;由于按从小到大排列的用户数量X,X,…,X可以用指数分布来近似,则对任意的1≤k<r≤n;12n有服从于F(2×(r-k),2k)分布;其中,约定X=0,令可得U的1-α的分位点为/>通过判断/>是否大于U,可以判断在置信区间1-α的条件下,异常点是否真实,并需要判断跳跃度最大处是否位于统计量众数处;01-α当大于U,且异常用户数量的起始点并非位于统计量的众数处时,认为X, …, X是不真实的用户数量。1-αk+1n