pandas 另一列高于平均值时的列最小值

r8uurelv  于 2023-02-14  发布在  其他
关注(0)|答案(2)|浏览(98)

我在做一些Python的练习题,我被一个问题卡住了。
我使用下面的泰坦尼克号 Dataframe :https://drive.google.com/file/d/1NEHvlUMTNPusHZvHUFTqeUR_9yY1tHVz/view
现在,我需要找到支付高于平均票价(“Fare”)的乘客的“Pclass”的每个等级的“Age”列的最小值。
使用这个我可以得到最低年龄组,但我怎么能添加'高于平均票价'的条件呢?

df.groupby('Pclass')['Age'].min()
0md85ypi

0md85ypi1#

给予这个

average_fare = df['Fare'].mean()
    
df.query("fare > @average_fare").groupby('Pclass_2').agg{'Age': ['min']}

Grouping by with Where conditions in Pandas
我可能有一些语法错误,因为它的一段时间以来,我已经做Pandas,如果有人看到一个问题,请纠正它

ymzxtsji

ymzxtsji2#

您可以:
1.求平均值
1.过滤器

  1. pivot_table,"Pclass"的每个类的"年龄"列的最小值
avrg_Fare = df['Fare'].mean()
df = df.loc[df['Fare'] > avrg_Fare]
PVT_min_age = df.pivot_table(index='Pclass', aggfunc={'Age':np.min}).reset_index()

相关问题