正如我们所说,就数据仓库而言,“精炼”比数据湖更加详尽。 数据仓库将根据其对特定目的的有用性提供数据,此外,还将为这些数据提供特定的格式,以便可以对其进行分析。 要实现的目标通常是对一个特定问题或一系列问题的答案,这将以报告的形式反映。 例如,数据仓库可以帮助公司检测客户人口统计数据并识别购买模式,目标是在一个方向或另一个方向指导营销工作。
或者它可以用来识别最有可能在竞争中离开的用户,目的是为他们 手机号码数据 提供保留客户的激励。 什么是数据湖? 数据湖以不同的方式工作。 正如我们所说,这是一个巨大的“湖”,其中的数据经过非常基本的预处理后存储,目的只是为了在必要的处理和分析时能够恢复。 因此,数据湖可以容纳来自不同来源和不同格式的许多不同类型的数据。 当然,这需要巨大的存储容量,通常比数据仓库的存储容量还要大(
这是数据湖通常被认为比数据仓库更接近大数据概念的主要原因之一)。 数据湖和数据仓库的不同结构将使每个选项具有不同的优点和缺点。 关于数据湖,人们常说它们更灵活、更敏捷(但也更广泛),而数据仓库则更结构化、更高效(但也说它们更僵化、适应性更差)。 两者都是存储和组织大量数据的不同方式,因此,每个选项都可以服务于大数据。食者或较小程度取决于要实现的目标。 此外,
|