我的数据是这样的:
| ID|阶段_1|阶段2|
| --|--|--|
| 1 |一|F|
| 1 |B| G|
| 1 |C| H|
| 2 |一|F|
| 2 |B| G|
| 2 |C| H|
| 3 |一|F|
| 3 |B| G|
| 4 |一|F|
| 4 |B| G|
我想找到Stage_1 = A
存在但Stage_2 = H
不存在的唯一ID的数量。这里,对于ID = 3
和ID = 4
,A存在于Stage_1
中,但在Stage_2
中,对于ID = 3
或ID = 4
没有H
。
所以这里的预期结果是2。Outer join
不适用,因为我使用hive sql终端只从数据库中的一个表中获取数据。
1条答案
按热度按时间qhhrdooz1#
您可以尝试将表的联接保留给表本身,并计算空值