使用pig查找pig表中每列中存在的所有数据的最大值

ma8fv8wu  于 2021-05-29  发布在  Hadoop
关注(0)|答案(1)|浏览(358)

输入格式:

Year_2010 , Year_2009, Year_2008

1.2, 2.4, 3.5
3.4, 3.8, 5.7
4.5, 5.6, 3.4
3.7, 2.6, 4.8

我尝试了以下脚本,它适用于1列。

A = Load '/Year.csv' Using PigStorage(',') as (Year_2010:double,Year_2009:double,Year_2008:double); 
B = group A ALL; 
max = Foreach B generate group,MAX(A.Year_2010);

预期产量:

Year_2010, Year_2009, Year_2008

4.5, 5.6, 5.7
3htmauhk

3htmauhk1#

在对列应用max之前,请先查看max.group。

A = Load '/Year.csv' Using PigStorage(',') as (Year_2010:double,Year_2009:double,Year_2008:double); 
B = GROUP A ALL;
C = FOREACH B GENERATE MAX(A.Year_2010),MAX(A.Year_2009),MAX(A.Year_2008);
DUMP C;

输出:

相关问题