pyspark中观测间隔更高

14ifxucb  于 2021-05-26  发布在  Spark
关注(0)|答案(0)|浏览(186)

我有一个pyspark数据框,它看起来像底部的那个,我在这里应用了一个窗口函数来计算滚动平均值,这个过程每隔1小时进行一次。
此数据集将与另一个在1小时内插值的数据集相结合。但是这个插值是10分钟,但是我还没有找到如何把这里的插值变成1小时来匹配其他数据集。
我从下面的表格开始;其中,我平均每10分钟出现的每个区域dk1和dk2的值。
参数化时间观测值区域风\速度时间2dk1风\速度相同时间3dk1风\速度相同时间4dk1
理想情况下,这将产生一个新的具有
参数化观察时间AVG值区域风速时间3dk1
我的结论如下表所示:我希望间隔是1小时而不是10分钟。
参数化观测时间行驶速度2017-01-01 00:00:008.29545DK1风速2017-01-01 00:10:008.3DK1风速2017-01-01 00:20:008.2227273DK1风速2017-01-01 00:30:008.10454545457DK1风速2017-01-01 00:40:008.10000000000001DK1风速2017-01-01 00:50:008.1181818181819DK1风速2017-01-0101:00:008.0681818DK1风速2017-01-01 01:10:007.921951219512194DK1风速2017-01-01:20:007.7379310344827585DK1风速2017-01-01:30:007.61578947364211DK1风速2017-01-01:40:007.563157894736841DK1风速2017-01-01:50:007.52631578943684DK1风速2017-01-01:00:007.5210526315789449DK1

暂无答案!

目前还没有任何答案,快来回答吧!

相关问题