如何在pig中消除同组时的标识符

oewdyzsn  于 2021-06-04  发布在  Hadoop
关注(0)|答案(1)|浏览(235)

我有10个数据集要加入。当我使用cogroup时,得到的结果如下

(50637,22284),{(50637,22284,278)},{(50637,22284,308)},{},{},{},{},{},{(50637,22284,17)},{(50637,22284,5)},{(50637,22284,1)}

如图所示,分组标识符在每个括号中都是重复的。我怎样才能得到以下格式的输出?

(50637,22284,278,308,0,0,0,0,0,17,5,1)
ds97pgxw

ds97pgxw1#

使用foreach/generate选择要保留的字段。看到了吗http://pig.apache.org/docs/r0.12.1/basic.html#foreach -嵌套投影

相关问题