数据1
1,a
2,b
3,c
4,d
5,e
数据2
1,a
2,g
3,j
4,b
5,c
6,d
7,e
脚本
a = load '/tmp/data/data1' using PigStorage(',') as (timestamp:chararray,constant:chararray);
b = load '/tmp/data/data2' using PigStorage(',') as (timestamp:chararray,constant:chararray);
我只需要输出一些常量,这些常量不常见,出现在data2中,如下所示
2,g
3,j
谢谢你的帮助。
1条答案
按热度按时间zfycwa2u1#
RIGHT OUTER JOIN
以及FILTER
其中a.timestamp为null。这将为您提供b中不在a中的所有记录。