Apache Spark 教程

Apache Spark 教程

Apache Spark 是一种闪电般快速的集群计算技术,专为快速计算而设计。它建立在 Hadoop MapReduce 之上,它扩展了 MapReduce 模型以有效地使用更多类型的计算,包括交互式查询和流处理。 这是一个简短的教程,解释了 Spark Core 编程的基础知识。


谁适合阅读?

本教程是为渴望使用 Spark 框架学习大数据分析基础知识并成为 Spark 开发人员的专业人士准备的。 此外,它对分析专业人员和 ETL 开发人员也很有用。


需要具备的知识?

在开始学习本教程之前,我们假设您之前已经接触过 Scala 编程、数据库概念和任何 Linux 操作系统风格。