我写了一个Python代码来平均分组的数字。在这里我想平均第5列分组第2列。
import numpy as np
import sys
import pandas as pd
df = pd.read_table("test.txt", delimiter=" ")
result = df.groupby(['radii']).mean()
np.savetxt('result.txt', result.values, fmt='%f')
我的数据是:
无半径晶状体数量密度
一0.0246136 3.9 0.0006 1.04692
二0.0246136五.9零0.0002零348973
三0.0738409七.九0.0018一04692
四0.0738409九.九0.0012
五0.123068 3.9 0.0014
六0.123068五.九0.0016
但是,不幸的是,我没有得到输出结果中的第二列(见下文):输出结果为:
1.50万美元4.90万美元0.000400 0.697947
350万美元890万美元001500美元0872432美元
5.50万美元4.90万美元0.0015万美元0.523459美元
我的预期结果是:
0.0246136美元和0.6979465美元
0.0738409美元
0.123068美元和0.523459美元
感谢您的评论
1条答案
按热度按时间6mzjoqzu1#
如果我没理解错的话,你需要加上
原因是分组依据的列变成了索引,通过重置索引,groupby列将变成 Dataframe 中的一列。