我必须创建一个函数,该函数将Pandas Dataframe 作为参数,并在将每列中的空值替换为该列中出现频率最高的值后返回 Dataframe 的副本。不能使用FOR或WHILE循环。
eulz3vhy1#
要创建一个副本,您可以简单地使用df.copy(deep = True)(注意deep = True创建一个新的dataframe-object,否则您将获得对复制的dataframe的引用)。要用最常用的值替换空值,您可以对Series和DataFrames(https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.mode.html)使用 mode 方法。例如:df = df.fillna(df.mode().iloc[0])
df.copy(deep = True)
df = df.fillna(df.mode().iloc[0])
1条答案
按热度按时间eulz3vhy1#
要创建一个副本,您可以简单地使用
df.copy(deep = True)
(注意deep = True创建一个新的dataframe-object,否则您将获得对复制的dataframe的引用)。要用最常用的值替换空值,您可以对Series和DataFrames(https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.mode.html)使用 mode 方法。例如:
df = df.fillna(df.mode().iloc[0])