添加特定的统计列,根据CSV文件中的ID和vists汇总云

yrefmtwq  于 2023-04-03  发布在  其他
关注(0)|答案(1)|浏览(80)

请我需要在 Dataframe 中更新当前的 Dataframe ,就像这样

ID      visit         feature 1      feature 2
1       m1              2               4
1       m2              5               9
1       m3              3               4
1       m4              4               0
2       m1
2       m2              5               6
2       m2              4               4
2       m4              3               3

我希望它汇总所有受试者在所有访视中的特征,并为每个受试者创建一行,包括所有特征的平均值、最大值和最小值,如下所示

ID      Max_feature1    min_feature1      max_feature2      min_feature2      
1          5                2                 9                  0
2         5                 3                 6                  3

因此,对于每个ID,要聚合所有ID的访问量并仅保存每个功能的统计功能,然后再次将其保存到CSV文件
任何帮助将不胜感激

t3psigkw

t3psigkw1#

您可以使用groupby,然后可选地扁平化multiindex:

df = df.groupby('ID')[['feature 1', 'feature 2']].agg(['min', 'max'])
df.columns = ["_".join(a) for a in df.columns.to_flat_index()]

输出:

feature 1_min  feature 1_max  feature 2_min  feature 2_max
ID                                                            
1             2.0            5.0            0.0            9.0
2             3.0            5.0            3.0            6.0

相关问题