Apache Pig - GetHour() 函数
此函数接受日期时间对象作为参数,并返回给定日期时间对象当天的当前小时。
语法
以下是 GetHour() 函数的语法。
grunt> GetHour(datetime)
示例
假设HDFS目录/pig_data/中有一个名为date.txt的文件,如下所示。 该文件包含特定人员的出生日期详细信息、ID、日期和时间。
date.txt
001,1989/09/26 09:00:00 002,1980/06/20 10:22:00 003,1990/12/19 03:11:44
并且,我们已将此文件加载到 Pig 中,其关系名为 date_data,如下所示。
grunt> date_data = LOAD 'hdfs://localhost:9000/pig_data/date.txt' USING PigStorage(',') as (id:int,date:chararray);
以下是 GetHour() 函数的示例。 GetHour() 函数将从给定的日期时间对象中检索一天中的小时。 因此,首先,我们使用 todate() 函数生成所有员工的 Date-Time 对象。
grunt> todate_data = foreach date_data generate ToDate(date,'yyyy/MM/dd HH:mm:ss') as (date_time:DateTime ); grunt> Dump todate_data; (1989-09-26T09:00:00.000+05:30) (1980-06-20T10:22:00.000+05:30) (1990-12-19T03:11:44.000+05:30)
现在让我们使用 GetDay() 函数获取每个员工出生时间的小时数,并将其存储在名为 gethour_data 的关系中。
grunt> gethour_data = foreach todate_data generate (date_time), GetHour(date_time);
现在使用 Dump 运算符验证 getday_data 关系的内容,如下所示。
grunt> Dump gethour_data; (1989-09-26T09:00:00.000+05:30,9) (1980-06-20T10:22:00.000+05:30,10) (1990-12-19T03:11:44.000+05:30,3)
apache_pig_date_time_functions.html