我有一个dataframe,我希望计算的基础上,商店和所有商店的平均值。我创建了计算平均值的代码,但我正在寻找一种更有效的方法。
DF
Cashier# Store# Sales Refunds
001 001 100 1
002 001 150 2
003 001 200 2
004 002 400 1
005 002 600 4
DF-所需
Cashier# Store# Sales Refunds Sales_StoreAvg Sales_All_Stores_Avg
001 001 100 1 150 290
002 001 150 2 150 290
003 001 200 2 150 290
004 002 400 1 500 290
005 002 600 4 500 290
我的尝试我创建了两个额外的 Dataframe ,然后做了左连接
df.groupby(['Store#']).sum().reset_index().groupby('Sales').mean()
2条答案
按热度按时间pcww981p1#
我认为你需要
DataFrameGroupBy.transform
来创建一个新列,其中填充了由mean
计算的聚合值:k5hmc34c2#
在
transform
和assign
中使用这个:输出: