例如,我有这样一个输入文件:
xxx,14 yyy,20 zzz,11
我想对第二个字段和输出求和。现在我知道如何使用hadoop pig对其求和,但我希望输出如下:
Canada,45
所以这意味着我自己把键名设为“canada”,然后加上和作为值。我如何自己设置密钥名称?
jchrr9hc1#
只需应用一个常量字段:
A = load 'data.txt' using PigStorage(',') as (txt:chararray, num:int); B = group A ALL; C = foreach B generate 'Canada' as country:chararray, SUM(A.num) as total:int;
1条答案
按热度按时间jchrr9hc1#
只需应用一个常量字段: