社区,
给出虹膜数据集的简单示例:
import pandas as pd
from sklearn.datasets import load_iris
iris = load_iris()
df_iris = pd.DataFrame(data= np.c_[iris['data'], iris['target']],
columns= iris['feature_names'] + ['target'])
df_iris['species'] = pd.Categorical.from_codes(iris.target, iris.target_names)
df_iris = df_iris.drop("target", axis=1)
df_iris = df_iris[df_iris['species'] != 'setosa']
为什么在过滤掉setosa之后,我仍然可以通过打印df_iris. species看到该类别?
这会在以后尝试通过seaborn可视化数据时产生问题。重置 Dataframe 的索引没有帮助。如何从 Dataframe 中完全删除setosa?
谢谢
1条答案
按热度按时间j9per5c41#
有一个函数
remove_unused_categories
就是为了这个目的:https://pandas.pydata.org/docs/reference/api/pandas.Series.cat.remove_unused_categories.html