假设有一个包含一些数据的表和一个包含日期的列:
column1, column2, date
a, a, 2016
a, b, 2016
a, c, 2017
b, d, 2017
b, e, 2017
这种情况是为每列1计算第2列出现次数,并为每列1应用最小日期。
第一部分是简单的分组。第二个可以通过partitionby子句获得。但我如何才能巧妙而清晰地将这两者结合起来呢?是否真的需要分区来获取最小日期?任何明智的建议都太好了!
预期产量:
column1, count, min_date
a, 3, 2016
b, 2, 2017
1条答案
按热度按时间mwkjh3gx1#
简单
group by
:我们来测试一下:
结果:
请注意,minu date为每个column1值选择了最小值。