将数据加载到配置单元数组列

ubbxdtey  于 2021-05-30  发布在  Hadoop
关注(0)|答案(1)|浏览(368)

我有两个配置单元表,如下所示,以及它们的列

Tbl_Customer
Id
Name

Tbl_Cntct
Id
Phone

一个身份证可以有很多电话号码,所以我有一张table

Tbl_All
Id
Name
Phn_List ARRAY

我的问题是如何将来自tbl\u custome和tbl\u cntct的数据加载到tbl\u all中。我可以在Pig身上做,但想在 hive 里做同样的事。
谢谢

rkue9o1l

rkue9o1l1#

Insert overwrite table Tbl_All
select cus.id,cus.name,collect_set(ctc.phone)
from Tbl_Customer cus join Tbl_Cntct ctc on cus.id = ctc.id
group by cus.id,cus.name

这个 collect_set udaf是一个函数,它将列收集到一个没有重复项的数组中 collect_list 功能

相关问题