← 返回列表

一种基于社区模型的图数据库的数据生成方法及装置

申请号: CN202311363022.X
申请人: 杭州悦数科技有限公司
申请日期: 2023/10/20

摘要文本

本申请涉及图数据库技术领域,解决了现有技术中公开数据集没有垂直领域的独特的特性,无法体现在某一特定领域内的性能特性的问题,公开了一种基于社区模型的图数据库的数据生成方法及装置,该方法包括:随机生成不重复的符合数据量要求的点数据;通过对社区模型进行特征分析来获取社区特征;根据社区模型和社区特征生成社区数据;从所述社区数据中抽取边数据,该方法可以保证生成的图数据具有一定的社区真实性,符合一定的业务领域特性,在做功能和性能测试时可以针对该领域做验证,可以模拟真实性数据用于验证图数据库的查询能力和图计算的算法能力。 来自马克数据网

专利详细信息

项目 内容
专利名称 一种基于社区模型的图数据库的数据生成方法及装置
专利类型 发明授权
申请号 CN202311363022.X
申请日 2023/10/20
公告号 CN117112847B
公开日 2024/2/6
IPC主分类号 G06F16/901
权利人 杭州悦数科技有限公司
发明人 王昌圆
地址 浙江省杭州市余杭区仓前街道时代未来之城5幢2201室

专利主权项内容

1.一种基于社区模型的图数据库的数据生成方法,其特征在于,包括:根据点数据量要求,随机生成不重复的符合数据量要求的点数据;通过对社区模型进行特征分析来获取社区特征;根据社区模型和社区特征生成社区数据,具体包括:遍历社区模型数据,将社区模型中的各类节点分别提取到Set集合,并针对不同类别的Set集合中的每一个点从随机生成的点数据中不放回的抽取一个点id形成一个Map映射集合,其中,Map映射集合中的键为社区模型中的点id,Map映射集合中的值为模拟生成的点id;再次遍历社区模型数据,对每种类别的点进行模拟点数据的替换;从所述社区数据中抽取边数据。