我有两个配置单元表,如下所示,以及它们的列
Tbl_Customer Id Name Tbl_Cntct Id Phone
一个身份证可以有很多电话号码,所以我有一张table
Tbl_All Id Name Phn_List ARRAY
我的问题是如何将来自tbl\u custome和tbl\u cntct的数据加载到tbl\u all中。我可以在Pig身上做,但想在 hive 里做同样的事。谢谢
rkue9o1l1#
Insert overwrite table Tbl_All select cus.id,cus.name,collect_set(ctc.phone) from Tbl_Customer cus join Tbl_Cntct ctc on cus.id = ctc.id group by cus.id,cus.name
这个 collect_set udaf是一个函数,它将列收集到一个没有重复项的数组中 collect_list 功能
collect_set
collect_list
1条答案
按热度按时间rkue9o1l1#
这个
collect_set
udaf是一个函数,它将列收集到一个没有重复项的数组中collect_list
功能