hadoop pig技术组(按函数)

eh57zj3b  于 2021-06-02  发布在  Hadoop
关注(0)|答案(1)|浏览(335)

我有一个亲戚

(zip-code).

我还有一个关系

(name:gender:zip-code)

(x:m:1234)

(y:f:1234)

(z:m:1245)

(s:f:1235).

我想把关系b中的数据按a分组

C = GROUP B BY A::zipcode;

预期产量:

(1234,{(y,f,1234),(x,m,1234)})

(1235,{(s,f,1235)})

(1245,{(z,m,1245)})
6ojccjat

6ojccjat1#

我看不出关系a的必要性。如果目标是按邮政编码字段分组,而邮政编码字段在关系b中已经存在,那么下面的代码就足够了。

C = GROUP B BY zip_code;

DUMP C; -- Will have the expected output.

相关问题