我在 hive 里有两张table
t1:
prod | rev
-------------
A | 1
A | 2
B | 1
B | 2
D | 1
t2:
prod | rev
-------------
A | 1
A | 2
B | 1
B | 2
C | 1
C | 2
我想将它们连接在一起,以便所有produdct(prod)和revisions(rev)都在最终的表中,例如。
t3:
prod | rev
-------------
A | 1
A | 2
B | 1
B | 2
C | 1
C | 2
D | 1
我试过,但只是不熟悉hql足以理解如何正确地做它。
我相信也许一个左联合然后联合然后右联合会奏效。以及在union all之后使用where语句来删除重复项,但我无法编写工作查询。我很乐意帮忙。
2条答案
按热度按时间wlwcrazw1#
一
union
我应该这么做。l5tcr1uw2#
你可以试试
UNION DISTINCT
可以消除输出中的重复项