pandas 随时间更改数据截止频率

o3imoua4  于 2022-11-20  发布在  其他
关注(0)|答案(1)|浏览(103)

我有一个结构为x1c 0d1x的数据
是否有一种方法可以将数据截止频率随时间(在python端,而不是SQL端)从30分钟切片更改为1小时,更改切片时必须满足一个条件,即对列“starts”和“scooter_on_parking”中的值求和,但对其余值求和 不应更改。基本命令

df.groupby(pd.Grouper(freq='1H', key='time_')).sum()

对所有列求和,如何保持部分不变-不太明白。谢谢。
更新:答案

new_df = ( df.groupby(pd.Grouper(freq='1H', key='time_')).agg({'starts':'sum', 
                               'scooters_on_parking':'sum'}).reset_index() )
new_df = new_df.merge(df, on='time_'

不拟合,则数据不正确-聚合后,数据差异很大。

实际值示例


结果

yzuktlbb

yzuktlbb1#

由于在groupby之后需要一个aggregation操作,因此将函数仅应用于某些列的最简单方法是在groupby之后使用merge

new_df = ( df.groupby(pd.Grouper(freq='1H', key='time_')).agg({'starts':'sum', 
                               'scooters_on_parking':'sum'}).reset_index() )
new_df = new_df.merge(df, on='time_')

相关问题