Apache Spark 教程
Apache Spark 是一种闪电般快速的集群计算技术,专为快速计算而设计。它建立在 Hadoop MapReduce 之上,它扩展了 MapReduce 模型以有效地使用更多类型的计算,包括交互式查询和流处理。 这是一个简短的教程,解释了 Spark Core 编程的基础知识。
谁适合阅读?
本教程是为渴望使用 Spark 框架学习大数据分析基础知识并成为 Spark 开发人员的专业人士准备的。 此外,它对分析专业人员和 ETL 开发人员也很有用。
需要具备的知识?
在开始学习本教程之前,我们假设您之前已经接触过 Scala 编程、数据库概念和任何 Linux 操作系统风格。