← 返回列表

一种文档数据库多表连接查询方法及装置

申请号: CN202311643055.X
申请人: 凯美瑞德(苏州)信息科技股份有限公司; 西北工业大学太仓长三角研究院
申请日期: 2023/12/4

摘要文本

本发明公开了一种文档数据库多表连接查询方法及装置,涉及数据处理技术领域。该方法的一具体实施方式包括:基于数据表的连接关系确定连接模式;将上述连接模式中的数据表转换为引用表,采用连接键作为分片键,对上述引用表进行分片;将分片后的引用表分布在分布式集群中的每个节点中;将查询指令分布至上述分布式集群中的节点上,并基于查询指令进行数据查询;汇总上述分布式集群中的每个节点的查询结果,生成总查询结果并进行反馈。该实施方式通过将连接键作为引用表的分片键,具有数值接近的分片键的文档位于相同分片,将分片平均分布至不同的节点中,使得在进行查询时,每个节点只需要对本地的数据进行查询,提高了数据读取效率。。数据由马 克 团 队整理

专利详细信息

项目 内容
专利名称 一种文档数据库多表连接查询方法及装置
专利类型 发明授权
申请号 CN202311643055.X
申请日 2023/12/4
公告号 CN117349321B
公开日 2024/3/5
IPC主分类号 G06F16/2453
权利人 凯美瑞德(苏州)信息科技股份有限公司; 西北工业大学太仓长三角研究院
发明人 孟江华; 姜栋琛; 董鸿毅; 王致茹; 李磊; 陈群; 刘海龙; 崔文辉
地址 江苏省苏州市中国(江苏)自由贸易试验区苏州片区八达街118号苏州新闻大厦2号楼901室; 江苏省苏州市太仓市科教新城子冈路27号

专利主权项内容

1.一种文档数据库多表连接查询方法,其特征在于,包括:基于数据表的连接关系确定连接模式;将所述连接模式中的数据表转换为引用表,采用连接键作为分片键,对所述引用表进行分片;将分片后的引用表分布在分布式集群中的每个节点中;将查询指令分布至所述分布式集群中的节点上,并基于查询指令进行数据查询;汇总所述分布式集群中的每个节点的查询结果,生成总查询结果并进行反馈;其中,所述将分片后的引用表分布在分布式集群中的每个节点中,包括:获取所述引用表的数据量;将所述引用表的数据量与第一预设数据量阈值进行对比;响应于所述引用表的数据量大于所述第一预设数据量阈值,将所述引用表的分片平均分布在所述分布式集群中的每个节点中;响应于所述引用表的数据量小于所述第一预设数据量阈值,将所述引用表复制并分发至所述分布式集群中的每个节点中。