← 返回列表

一种基于网络大数据的主题公园运行监测方法及系统

申请号: CN202311702672.2
申请人: 中国测绘科学研究院
申请日期: 2023/12/12

摘要文本

本发明公开了一种基于网络大数据的主题公园运行监测方法及系统,设计获取目标旅游平台网站爬虫;运行爬虫获取原始网络大数据;原始数据清洗,按需求对数据进行处理并存入时间序列数据库;多源数据整合,按规则将数据融合;利用时间序列异常检测方法对融合后时间序列数据进行分析,自动获取主题公园异常运行时间段;将分析后数据进行可视化,标注异常运行时间段;按时重复监测过程,实现监测数据的实时化更新。本发明的有益效果是:实时化地采用网络大数据对主题公园运行状态进行分析评估,实现时间快,可以保证较高的更新频率;基于多源的网络信息,数据来源丰富,准确性高。 该数据由<专利查询网>整理

专利详细信息

项目 内容
专利名称 一种基于网络大数据的主题公园运行监测方法及系统
专利类型 发明授权
申请号 CN202311702672.2
申请日 2023/12/12
公告号 CN117390249B
公开日 2024/3/12
IPC主分类号 G06F16/951
权利人 中国测绘科学研究院
发明人 董春; 于浩洋; 张玉; 康风光; 亢晓琛
地址 北京市海淀区莲花池西路28号

专利主权项内容

1.一种基于网络大数据的主题公园运行监测方法,其特征在于:包括以下步骤:根据目标旅游网站的架构特性确定目标旅游网站的数据特点,对所述目标旅游网站的网页数据进行解析,从而建立目标爬虫与所述目标旅游网站中的主题公园对应信息之间的逻辑关系,基于所述逻辑关系设计并获取所述目标爬虫;通过所述目标爬虫从所述目标旅游网站中爬取到原始网络大数据,对所述原始网络大数据进行清洗、整合以及融合后得到最终融合数据;通过对所述最终融合数据进行分析,得到主题公园数据分析结果,将所述主题公园数据分析结果以可视化视图的形式进行实时展示,并对主题公园运行状态异常的时间段进行标注,包括利用所述最终融合数据,获取主题公园游客热度变化趋势的时间序列;通过时间序列异常检测方法对所述时间序列进行分析,识别出主题公园停运/游客量低下的异常时间段,其中,通过阈值对所述时间序列进行区间异常检测,将小于阈值的时间节点作为区间异常节点集合;对时间序列进行常数波动检测,以任一时间节点为中心建立滑动窗口遍历时间序列,根据遍历结果获得滑动窗口内的最大值序列与最小值序列,计算最大值序列与最小值序列之差小于阈值的时间节点,将计算结果对应的滑动窗口内的时间节点作为常数波动异常节点集合;取区间异常节点集合和常数波动异常节点集合的交集作为筛选异常节点集合;通过滑动窗口遍历所述筛选异常节点集合,从所述筛选异常节点集合中剔除持续时间小于时间阈值的异常节点,获取持续大于时间阈值的异常时间节点,形成最终异常节点集合,所述最终异常节点集合表示为主题公园较长时间停运或游客量低下的时间段;将所述异常时间段与网站售票情况进行结合分析得到主题公园的运行状态,包括:结合当前的售票信息,分析主题公园当前运行状态,若当前处于异常时间段且售票停止,则判定主题公园处于停业状态;若当前不处于异常时间段且正常售票,则判定主题公园处于正常营业状态;若当前异常状态与售票情况不符,则进行记录以待人工进一步核验;设定预设数据爬取时段,根据所述预设数据爬取时段定时爬取所述目标旅游网站中的主题公园对应的原始网络大数据,不断对所述原始网络大数据进行更新和分析,实现主题公园游客热度和运行状态的实时化监测。