我有一个结构为x1c 0d1x的数据
是否有一种方法可以将数据截止频率随时间(在python端,而不是SQL端)从30分钟切片更改为1小时,更改切片时必须满足一个条件,即对列“starts”和“scooter_on_parking”中的值求和,但对其余值求和 不应更改。基本命令
df.groupby(pd.Grouper(freq='1H', key='time_')).sum()
对所有列求和,如何保持部分不变-不太明白。谢谢。
更新:答案
new_df = ( df.groupby(pd.Grouper(freq='1H', key='time_')).agg({'starts':'sum',
'scooters_on_parking':'sum'}).reset_index() )
new_df = new_df.merge(df, on='time_'
不拟合,则数据不正确-聚合后,数据差异很大。
实际值示例
。
结果
1条答案
按热度按时间yzuktlbb1#
由于在
groupby
之后需要一个aggregation
操作,因此将函数仅应用于某些列的最简单方法是在groupby
之后使用merge
: