我有这样一个泛型关系:
DUMP A;
(a, b)
(a, c)
(a, d)
(b, a)
(d, a)
(d, b)
看到有一对(a,b)和(b,a);但是(d,b)没有一对。我想过滤掉那些“未配对”的元组。
最终结果应该是:
DUMP R;
(a, b)
(a, d)
(b, a)
(d, a)
我怎么能把这个写在Pig身上?
我可以用下面的代码解决,但是交叉操作太贵了:
A_cp = FOREACH L GENERATE u1, u2;
X = CROSS A, A_cp;
F = FILTER X BY ($0 == $3 AND $1 == $2);
R = FOREACH F GENERATE $0, $1;
1条答案
按热度按时间utugiqy61#
这是我的
DESCRIBE A ; DUMP A ;
:这是解决问题的一种方法:
输出:
更新:正如winnienicklaus指出的,这可以缩短为: