pyspark中基于时间范围的Dataframe分割

whhtz7ly  于 2021-05-17  发布在  Spark
关注(0)|答案(0)|浏览(356)

我有以下三天的数据:

time,data
2020-10-08 11:11:58, 12
2020-10-09 00:00:03, 06
2020-10-09 00:00:08, 49
2020-10-09 00:00:13, 67
2020-10-09 11:11:57, 39
2020-10-10 00:00:08, 12
2020-10-10 00:00:13, 15
2020-10-10 00:00:18, 19
2020-10-10 00:00:23, 25
2020-10-10 11:11:56, 25
2020-10-11 00:00:03, 25

我可以通过创建date列,拆分成分区,然后在每个分区中求和,轻松地在每日级别上进行聚合。
当我必须对每天的最后一个时间戳进行相同的计算时,我不知道如何将其拆分为下一个即将到来的时间戳,即。 2020-10-08 11:11:582020-10-09 11:11:57 谢谢你的帮助。

暂无答案!

目前还没有任何答案,快来回答吧!

相关问题