HCatalog 教程

HCatalog 教程

HCatalog 是 Hadoop 的表存储管理工具,可将 Hive 元存储的表格数据公开给其他 Hadoop 应用程序。它使使用不同数据处理工具(Pig、MapReduce)的用户能够轻松地将数据写入网格。 HCatalog 确保用户无需担心其数据存储在何处或以何种格式存储。这是一个简短的教程,仅介绍 HCatalog 的基础知识及其使用方法。

谁适合阅读?

本教程面向希望使用 Hadoop 框架从事大数据分析工作的专业人士。ETL 开发人员和从事分析工作的专业人士也可以使用本教程获得良好收获。

需要具备的知识?

在继续本教程之前,您需要具备核心 Java、SQL 数据库概念、Hadoop 文件系统和任何 Linux 操作系统版本的基本知识。