组织通常面临管理分散在多个系统、数据库和应用程序中的数据的挑战。这种碎片化会形成数据孤岛,阻碍数据访问和集成。这使得组织难以充分利用其数据资产。
数据联合为这个问题提供了解决方案。数据联合无需物理移动或整合数据,而是提供一种虚拟化方法,让用户可以实时访问和查询来自多个来源的数据。
如果您想了解有关数据管理的更多信息,请查看本系列的其他文章:
什么是数据结构?
什么是数据沿袭?
什么是数据网格?
您还应该查看我们的网络 viber 数据库 研讨会,探讨如何构建您组织的数据和人工智能成熟度。
培训 2 人或更多人?查看我们的商业解决方案
让您的团队访问完整的 DataCamp 库,其中包含集中报告、任务、项目等
商业主页英雄.png
什么是数据联合?
数据联合是一种数据集成技术,它提供来自多个来源的数据的统一视图,而无需物理整合。可以将其想象为一种复杂的机制,它允许您实时访问和查询各种系统中的数据,就好像它们都存储在一个位置一样。
许多组织处理来自不同来源的大量数据。能够实时访问和分析这些数据而不必担心数据重复,对于做出明智的决策至关重要。数据联合可以实现这一点。
数据联合也用于某些数据架构中来整合数据,例如数据结构(请阅读本文以了解更多有关数据结构的内容)。
该图是数据联合的简化视图。
上图是数据联合的简化视图。数据联合将来自许多不同来源的数据虚拟化并聚合起来,以供数据消费者进行交互。
核心原则
数据联合遵循几个核心原则。让我们来了解一下其中的几个。
虚拟化
数据联合无需物理地重新定位数据,而是将数据保留在原始源位置,并通过虚拟层进行访问。这种方法消除了数据复制的需要,同时确保实时访问最新信息。通过虚拟化数据访问,组织可以在原始位置保持数据的完整性和安全性,同时受益于统一的视图。
统一访问
用户与单一界面或查询语言进行交互,简化了从多个来源访问数据的过程。这种统一的访问方式简化了数据检索。此过程使分析师、数据科学家和其他利益相关者能够轻松查询和分析数据,而无需处理每个数据源的复杂性。
架构映射
架构是定义数据库中数据组织方式的蓝图。数据源通常具有不同的架构,这意味着它们以不同的方式组织和标记数据。架构映射涉及对齐这些架构以创建一致的数据视图。
例如,一个数据源可能使用“CustomerID”来引用客户标识符,而另一个数据源可能使用“CustID”。架构映射将这些不同的标签转换为可理解为同一实体。
通过协调不同的模式,数据联合工具可确保无缝集成来自不同来源的数据。这提供了一致且可靠的数据模型,用户可以信赖该模型来进行准确的分析和报告。
按需处理
数据联合强调按需处理。查询在联合源之间实时执行,最大限度地减少数据重复并确保用户访问最新的数据。这种动态处理能力对于及时决策和分析至关重要。通过按需处理数据,数据联合支持敏捷和明智的决策。
数据联合的工作原理
现在我们知道了什么是数据联合,让我们看看它是如何工作的。
建筑学
数据联合无缝集成来自不同来源的数据。其核心是一种结构化架构,旨在有效地促进这种集成。该架构由三个主要部分组成:
数据源
整合数据源的联邦层
查询数据的数据消费者
数据源
数据源可以看作是孤岛,每个孤岛都包含有价