← 返回列表
面向数据治理的关系数据表关联重建方法和装置
摘要文本
本申请提供了一种面向数据治理的关系数据表关联重建方法和装置,该方法包括:对数据表集合中的数据表进行相同关系计算,得到互异表集合和相同关系关联表图;对互异表集合中的数据表进行相似关系计算,得到相似关系关联表图;基于数据表主外键字段,对互异表集合中除具有相似关系的数据表进行实体关系计算,得到实体关系关联表图;根据相同关系关联表图、相似关系关联表图和实体关系关联表图,得到表征数据表关联的初始关联表图;利用度中心算法对初始关联表图进行核心数据表提取和传递引用消除,得到最终的关联表图和核心数据表。本申请基于实体关系和数据血缘关系来重构数据表的关联,考虑的关系更全面,得到的关联图表和核心数据表更加准确。
申请人信息
- 申请人:国家开放大学
- 申请人地址:100045 北京市西城区复兴门内大街160号
- 发明人: 国家开放大学
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 面向数据治理的关系数据表关联重建方法和装置 |
| 专利类型 | 发明申请 |
| 申请号 | CN202311368209.9 |
| 申请日 | 2023/10/20 |
| 公告号 | CN117539861A |
| 公开日 | 2024/2/9 |
| IPC主分类号 | G06F16/22 |
| 权利人 | 国家开放大学 |
| 发明人 | 蔡斯博; 潘奇 |
| 地址 | 北京市西城区复兴门内大街160号 |
专利主权项内容
1.一种面向数据治理的关系数据表关联重建方法,其特征在于,所述方法包括:对数据表集合中的数据表进行相同关系计算,得到互异表集合和相同关系关联表图,相同关系是指为结构完全相同的数据表之间建立的关联;对所述互异表集合中的数据表进行相似关系计算,得到相似关系关联表图,相似关系是指为结构存在相似的数据表之间建立的关联,所述相同关系和所述相似关系均为数据血缘关系;基于数据表主外键字段,对所述互异表集合中除具有相似关系的数据表进行实体关系计算,得到实体关系关联表图,实体关系是指为存在业务逻辑联系的数据表之间建立的关联;根据所述相同关系关联表图、所述相似关系关联表图和所述实体关系关联表图,得到表征数据表关联的初始关联表图;利用度中心算法对所述初始关联表图进行核心数据表提取和传递引用消除,得到最终的关联表图和核心数据表。