在hadoop中连接文件a、b、c

emeijp43  于 2021-06-03  发布在  Hadoop
关注(0)|答案(1)|浏览(302)

这个问题在这里已经有了答案

8年前关门了。
可能重复:
pig脚本:连接多个文件
我做了一个基于hadoop的程序。现在,我有三个文件a,b,c。我想加入他们,遵循条件“a.one=b.one,a.two=c.one”;然后将结果存储到文件d中。
我对pig略知一二,但它的join不能满足这个命令。

gcuhipw9

gcuhipw91#

实际上,在pig中,两步连接很容易:

A=LOAD ..
B=LOAD ..
C=LOAD ..

AB= JOIN A BY A.one,B BY B.One;
D= JOIN AB BY A::two, C BY C.one;

相关问题