pandas 如何处理离群数据(多列)

mklgxw1f  于 2022-11-27  发布在  其他
关注(0)|答案(1)|浏览(145)

我有一个数据集,其中包含许多列数据,我想检查其中是否有超过100的数据,如果有,我只删除整行数据。[some data][1]
我试着用

useful_data = data[(data)['a1'] <= 100]
useful_data = data[(data)['a2'] <= 100]
useful_data = data[(data)['a3'] <= 100]
useful_data = data[(data)['a4'] <= 100]
useful_data = data[(data)['a5'] <= 100]
useful_data = data[(data)['a6'] <= 100]
useful_data = data[(data)['a7'] <= 100]
useful_data = data[(data)['a8'] <= 100]

但这似乎不起作用,因为我一遍又一遍地重新分配useful_data。
我的问题是:如何去除离群数据并使其整洁?我不想重复工作。[1]:https://i.stack.imgur.com/SNZtz.png

yiytaume

yiytaume1#

这应该对你有用

data = pd.DataFrame({'a1':[98, 87, 78, 101, 45], 
                     'a2':[89, 98, 23, 43, 102],
                     'a3':[120, 9, 23, 12, 122]})

new_data = data[data[data.columns.values]<= 100]
new_data = new_data.dropna()

这是此代码的输出

a1    a2    a3
1  87.0  98.0   9.0
2  78.0  23.0  23.0

相关问题