我有一张table如下:
ID start date name type
1 2020/01/01 cheese,meat A, B
1 2020/01/01 cheese,fruit A, C
所需输出应为:
ID start date count type
1 2020/01/01 cheese,meat,fruit A,B,C
我试过了 collect_list
以及 collect_set
,但两者都不起作用。
3条答案
按热度按时间but5z9lq1#
您可以拆分和分解列,然后按分组并收集集合:
mrphzbgm2#
你可以用
array_distinct
删除后的重复项collect_set
:另一种使用
regexp_replace
要删除重复项:suzh9iv83#
您可以使用:
结果: