Apache Pig - TextLoader() 函数
Pig Latin 函数 TextLoader() 是一个 Load 函数,用于加载 UTF-8 格式的非结构化数据。
语法
下面给出的是TextLoader()函数的语法。
grunt> TextLoader()
示例
假设 HDFS 目录 /data/ 中有一个名为 stu_data.txt 的文件,如下所示。
001,Rajiv_Reddy,21,Hyderabad 002,siddarth_Battacharya,22,Kolkata 003,Rajesh_Khanna,22,Delhi 004,Preethi_Agarwal,21,Pune 005,Trupthi_Mohanthy,23,Bhuwaneshwar 006,Archana_Mishra,23,Chennai 007,Komal_Nayak,24,trivendram 008,Bharathi_Nambiayar,24,Chennai
现在让我们使用 TextLoader() 函数加载上述文件。
grunt> details = LOAD 'hdfs://localhost:9000/pig_data/stu_data.txt' USING TextLoader();
您可以使用 Dump 运算符验证加载的数据。
grunt> dump details; (001,Rajiv_Reddy,21,Hyderabad) (002,siddarth_Battacharya,22,Kolkata) (003,Rajesh_Khanna,22,Delhi) (004,Preethi_Agarwal,21,Pune) (005,Trupthi_Mohanthy,23,Bhuwaneshwar) (006,Archana_Mishra,23,Chennai) (007,Komal_Nayak,24,trivendram) (008,Bharathi_Nambiayar,24,Chennai)
apache_pig_load_store_functions.html