← 返回列表
一种基于跨分布模式的关联查询优化方法
申请人信息
- 申请人:天津南大通用数据技术股份有限公司
- 申请人地址:300384 天津市滨海新区华苑产业区海泰发展六道6号海泰绿色产业基地J座
- 发明人: 天津南大通用数据技术股份有限公司
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种基于跨分布模式的关联查询优化方法 |
| 专利类型 | 发明授权 |
| 申请号 | CN202311361464.0 |
| 申请日 | 2023/10/20 |
| 公告号 | CN117131078B |
| 公开日 | 2024/2/6 |
| IPC主分类号 | G06F16/2453 |
| 权利人 | 天津南大通用数据技术股份有限公司 |
| 发明人 | 刘新亮; 崔杰 |
| 地址 | 天津市滨海新区华苑产业区海泰发展六道6号海泰绿色产业基地J座 |
摘要文本
天津南大通用数据技术股份有限公司取得“一种透气窗帘布”专利技术,本发明提供了一种基于跨分布模式的关联查询优化方法,包括:在数据库中新增一张系统表,记录所有表的分布信息,包括表名、所属分布模式、分片和分布键;对于数据库中的两个需要进行关联查询的分布表,在执行关联查询的阶段,根据系统表的记录,判断两个分布表是否分别属于不同的分布模式,以及是否存在包含关系;根据两个分布表的分布模式及两个分布表之间的包含关系,判断在关联查询的过程中是否需要执行拉表操作。本发明有益效果:在同一集群存在多种分布模式的场景下,使包含关系下的分布各表,在关联查询时不产生数据重分布和多余计划步骤等耗时操作,从而极大地节省了时间并大幅提升了性能。
专利主权项内容
1.一种基于跨分布模式的关联查询优化方法,其特征在于,包括:在数据库中新增一张系统表,记录所有表的分布信息,包括表名、所属分布模式、分片数、分布键;对于数据库中的两个需要进行关联查询的分布表,在执行关联查询的阶段,根据系统表的记录判断两个分布表是否分别属于不同的分布模式;根据分布模式的判断结果,对两个分布表是否存在包含关系进行判断;当两个分布表属于不同的分布模式且两个分布表不存在包含关系时,执行拉表操作,否则进行混合关联查询判断;所述拉表操作为,将其中一个分布表的数据根据关联条件拉取到另一个分布表所在的节点IP上,然后在每个节点IP上进行关联计算的操作所述分布模式包括DIST1模式和DIST2模式:当分布表处于任一分布模式时,分布表均被划分为多个分片,其中:当分布表处于DIST1模式时,部分分片拥有一个备片;当分布表处于DIST2模式时,所有分片均拥有一个备片。