这个问题在这里已经有了答案:
8年前关门了。可能重复:pig脚本:连接多个文件我做了一个基于hadoop的程序。现在,我有三个文件a,b,c。我想加入他们,遵循条件“a.one=b.one,a.two=c.one”;然后将结果存储到文件d中。我对pig略知一二,但它的join不能满足这个命令。
gcuhipw91#
实际上,在pig中,两步连接很容易:
A=LOAD .. B=LOAD .. C=LOAD .. AB= JOIN A BY A.one,B BY B.One; D= JOIN AB BY A::two, C BY C.one;
1条答案
按热度按时间gcuhipw91#
实际上,在pig中,两步连接很容易: