我有10个数据集要加入。当我使用cogroup时,得到的结果如下
(50637,22284),{(50637,22284,278)},{(50637,22284,308)},{},{},{},{},{},{(50637,22284,17)},{(50637,22284,5)},{(50637,22284,1)}
如图所示,分组标识符在每个括号中都是重复的。我怎样才能得到以下格式的输出?
(50637,22284,278,308,0,0,0,0,0,17,5,1)
ds97pgxw1#
使用foreach/generate选择要保留的字段。看到了吗http://pig.apache.org/docs/r0.12.1/basic.html#foreach -嵌套投影
1条答案
按热度按时间ds97pgxw1#
使用foreach/generate选择要保留的字段。看到了吗http://pig.apache.org/docs/r0.12.1/basic.html#foreach -嵌套投影