Apache Pig - GetYear() 函数

此函数接受日期时间对象作为参数,并从给定的日期时间对象返回当前年份。

语法

以下是 GetYear() 函数的语法。

grunt> GetYear(datetime)

示例

假设HDFS目录/pig_data/中有一个名为date.txt的文件,如下所示。 该文件包含特定人员的出生日期详细信息,包括人员 ID、日期和时间。

date.txt

001,1989/09/26 09:00:00
002,1980/06/20 10:22:00
003,1990/12/19 03:11:44

并且,我们已将此文件加载到 Pig 中,其关系名为 date_data,如下所示。

grunt> date_data = LOAD 'hdfs://localhost:9000/pig_data/date.txt' USING PigStorage(',')
   as (id:int,date:chararray);

以下是 GetYear() 函数的示例。 它将从给定的日期时间对象检索当前年份。 因此,首先让我们使用 todate() 函数生成所有员工的日期时间对象,如下所示。

grunt> todate_data = foreach date_data generate ToDate(date,'yyyy/MM/dd HH:mm:ss')
   as (date_time:DateTime );
  
grunt> Dump todate_data;
(1989-09-26T09:00:00.000+05:30) 
(1980-06-20T10:22:00.000+05:30) 
(1990-12-19T03:11:44.000+05:30) 

现在让我们使用 GetYear() 函数从每个员工的出生日期获取年份,并将其存储在名为 getyear_data 的关系中。

grunt> getyear_data = foreach todate_data generate (date_time), GetYear(date_time);

现在使用 Dump 运算符验证 getyear_data 关系的内容,如下所示。

grunt> Dump getyear_data;
  
(1989-09-26T09:00:00.000+05:30,1989) 
(1980-06-20T10:22:00.000+05:30,1980) 
(1990-12-19T03:11:44.000+05:30,1990) 

apache_pig_date_time_functions.html