我正在处理地表水位置和地下水井位置的水质数据。我想为所有三个参数(pH值、温度、盐度)创建一个汇总统计表,按采样位置(地表水与地下水)分组,如下所示:
| 'Surface Water' | 'Groundwater' |
___________________________________________________________________________
| min | max | mean | std | min | max | mean | std
'pH'
设置Excel工作表以进行数据收集的方法包括以下列:日期、监测ID(地表水或地下水)、pH值、温度和盐度。
我怎样才能告诉python去做这个呢?我熟悉groupby和describe()函数,但是我不知道如何按照我想要的方式来组织它。任何帮助都将不胜感激!
我试着对每个描述性统计数据使用groupby函数,例如:
mean = df.\
groupby('Monitoring ID')\
[['pH', 'SAL (ppt)', 'Temperature (°C)', 'DO (mg/L)']].mean()
min = df.\
groupby('Monitoring ID')\
[['pH', 'SAL (ppt)', 'Temperature (°C)', 'DO (mg/L)']].min()
等等......但是我不知道如何把所有的都整合到一张漂亮的table里
2条答案
按热度按时间bmp9r5qi1#
您可以按照建议使用
groupby_describe
,然后使用stack_transpose
:sirbozc52#
您可以将
agg
与groupby
沿着使用:对不起,我仍然在试图弄清楚如何在这里演示代码的输出,但我希望这能有所帮助。