Apache Pig 教程

Apache Pig 教程

Apache Pig 是 MapReduce 的抽象。 它是一个工具/平台,用于分析将其表示为数据流的较大数据集。 Pig一般与Hadoop一起使用; 我们可以使用 Pig 执行 Hadoop 中的所有数据操作操作。

谁适合阅读?

本教程面向所有从事 Hadoop 工作、希望执行 MapReduce 操作而无需在 Java 中键入复杂代码的专业人士。

需要具备的知识?

要充分了解本教程,您应该充分了解 Hadoop 和 HDFS 命令的基础知识。 如果您擅长 SQL,这肯定会有所帮助。