如果一列连续具有相同的值,我必须创建一个对应字段值的列表,如果出现相同的值,则必须创建另一个列表。我试过了 collect_list()
但它将同一列按顺序分组。表格如下。
| Timestamp | id | Grp | CD |
|-----------|----|-----|----|
| 05:59 | 1 | A | W1 |
| 06:00 | 1 | A | W2 |
| 7:00 | 1 | B | W3 |
| 7:00 | 1 | A | W4 |
| 7:01 | 1 | A | W5 |
| 7:02 | 1 | A | W6 |
表按时间戳排序。
我希望结果如下
| id | agg |
|----|------------|
| 1 | [W1,W2] |
| 1 | [W3] |
| 1 | [W4,W5,W6] |
1条答案
按热度按时间7cjasjjr1#
我曾为我的团队尝试过类似的场景。请在下面找到。
输入
输出: