Apache Flink - 大数据平台

过去 10 年数据的进步是巨大的; 这产生了"大数据"这个术语。 数据没有固定大小,可以称之为大数据; 传统系统(RDBMS)无法处理的任何数据都是大数据。 该大数据可以是结构化、半结构化或非结构化格式。 最初,数据有三个维度 − Volume, Velocity, Variety(数量、速度、多样性)。 现在的维度已经超出了三个V。 我们现在添加了其他 V − Veracity, Validity, Vulnerability, Value, Variability(真实性、有效性、漏洞、价值、可变性)等。

大数据导致了多种有助于数据存储和处理的工具和框架的出现。 有一些流行的大数据框架,如 Hadoop、Spark、Hive、Pig、Storm 和 Zookeeper。 它还提供了在医疗保健、金融、零售、电子商务等多个领域创建下一代产品的机会。

无论是跨国公司还是初创企业,每个人都在利用大数据来存储和处理数据并做出更明智的决策。