pig::从组的计数中获取最大值

ltqd579y  于 2021-06-21  发布在  Pig
关注(0)|答案(1)|浏览(583)

我有一个文件库名称,位置和其他几个领域太多。我想找出分行最多的那家银行。

A = LOAD 'bank.txt';
B = GROUP A by $0;
C = FOREACH B GENERATE COUNT($1);

我去银行算帐。现在我被困在如何参考c获得最大分行的银行。

bq3bfh9z

bq3bfh9z1#

因为您是按银行分组的,所以必须生成分组并对表示分支的字段进行计数,然后按计数说明排序并获取最上面的行。

A = LOAD 'bank.txt';
B = GROUP A by $0;
C = FOREACH B GENERATE group as Bank,COUNT(B.Branches_Field) cnt;
D = ORDER C BY cnt DESC;
E = LIMIT D 1;
DUMP E;

相关问题