我习惯用NaN替换空字符串,并删除空数据。
import pandas as pd
import numpy as np
df.replace('', np.nan).dropna()
字符串
然而,我希望我的函数使用无服务器框架运行。我需要import numpy
来使用np.nan
,这消耗了我宝贵的250MB包大小限制。
pandas pd.np.nan
工作正常,但有警告称pandas.np
模块已被弃用,并将从pandas的未来版本中删除。
有没有解决方案可以在不导入numpy的情况下使用np.nan
?
3条答案
按热度按时间bihw5rsg1#
也许你可以用
math
来逃避:字符串
或者甚至不导入任何内容:
型
这些与NumPy的
nan
兼容:型
ttvkxqim2#
使用
pd.NA
代替。来自于:
从pandas 1.0开始,实验性的
pd.NA
值(singleton)可用于表示标量缺失值。目前,它用于可空整数,布尔和专用字符串数据类型中作为缺失值指示符。pd.NA
的目标是提供一个可以在不同数据类型中一致使用的“缺失”指示符(而不是np.nan
、None
或pd.NaT
,具体取决于数据类型)。sirbozc53#
也许我忽略了一些明显的东西,但是
df.replace('', None).dropna()
应该可以工作,对吗?