我想在使用配置单元时删除阵列中的连续重复项。 collect_list()
保留所有副本,同时 collect_set()
只保留不同的条目。我需要一些中间的东西。
例如,从下表:
id | number
==============
fk 4
fk 4
fk 2
4f 1
4f 8
4f 8
h9 7
h9 4
h9 7
我想得到这样的东西:
id | aggregate
===========================
fk Array<int>(4,2)
4f Array<int>(1,8)
h9 Array<int>(7,4,7)
1条答案
按热度按时间qyyhg6bp1#
使用
lag()
解析函数,用于获取前一个数字并与当前数字进行比较,以检查连续的数字。演示:
结果: