In [7]: s = pd.Series([True, True, False, True])
In [8]: ~s
Out[8]:
0 False
1 False
2 True
3 False
dtype: bool
使用Python 2.7、NumPy 1.8.0、Pandas 0.13.1:
In [119]: s = pd.Series([True, True, False, True]*10000)
In [10]: %timeit np.invert(s)
10000 loops, best of 3: 91.8 µs per loop
In [11]: %timeit ~s
10000 loops, best of 3: 73.5 µs per loop
In [12]: %timeit (-s)
10000 loops, best of 3: 73.5 µs per loop
In [1]: import numpy as np
In [2]: import pandas as pd
In [3]: s = pd.Series([True, True, False, True])
In [4]: np.invert(s)
Out[4]:
0 False
1 False
2 True
3 False
In [5]: %timeit (-s)
10000 loops, best of 3: 26.8 us per loop
In [6]: %timeit np.invert(s)
100000 loops, best of 3: 7.85 us per loop
In [7]: %timeit ~s
10000 loops, best of 3: 27.3 us per loop
In[1]: series = pd.Series([True, np.nan, False, np.nan])
In[2]: series = series[series.notna()] #remove nan values
In[3]: series # without nan
Out[3]:
0 True
2 False
dtype: object
# Out[4] expected to be inverse of Out[3], pandas applies bitwise complement
# operator instead as in `lambda x : (-1*x)-1`
In[4]: ~series
Out[4]:
0 -2
2 -1
dtype: object
作为一个简单的非矢量化解决方案,你可以,1。检查类型2.逆布尔
In[1]: series = pd.Series([True, np.nan, False, np.nan])
In[2]: series = series.apply(lambda x : not x if x is bool else x)
Out[2]:
Out[2]:
0 True
1 NaN
2 False
3 NaN
dtype: object
7条答案
按热度按时间g0czyy6m1#
要反转布尔级数,请使用
~s
:使用Python 2.7、NumPy 1.8.0、Pandas 0.13.1:
从Pandas 0.13.0开始,Series不再是
numpy.ndarray
的子类;它们现在是pd.NDFrame
的子类。这可能与为什么np.invert(s)
不再像~s
或-s
那么快有关。注意:
timeit
的结果可能会因许多因素而异,包括硬件,编译器,操作系统,Python,NumPy和Pandas版本。sqserrrh2#
@unutbu的回答是正确的,只是想添加一个警告,你的掩码需要是dtype bool,而不是'object'。也就是说你的面具不可能有任何的奶奶。看这里-即使你的面具现在是nan自由的,它将仍然是'对象'类型。
一个“object”序列的逆序列不会抛出错误,相反,你会得到一个垃圾掩码,它不会像你期望的那样工作。
在与同事讨论了这个问题后,我有一个解释:看起来pandas正在恢复到位运算符:
就像@geher说的,你可以在用~求逆之前用astype把它转换成bool。
mwkjh3gx3#
我就给予一次机会:
zc0qhyus4#
也可以使用
numpy.invert
:编辑:性能差异出现在Ubuntu 12.04,Python 2.7,NumPy 1.7.0上-使用NumPy 1.6.2似乎不存在:
gj3fmq9x5#
为了支持这里的优秀答案,也为了将来的方便,可能会出现这样的情况:您希望翻转列中的真值,并使其他值保持不变(例如nan值)
作为一个简单的非矢量化解决方案,你可以,1。检查类型2.逆布尔
lvjbypge6#
NumPy速度较慢,因为它将输入转换为布尔值(因此None和0变为False,其他所有内容都变为True)。
给你
而~s则会崩溃。在大多数情况下,波浪号是比NumPy更安全的选择。
Pandas 0.25,NumPy 1.17
bkhjykvo7#
如果你的答案有任何类型的
<NA>
np.nan
或类似的,我建议这样做:它保持你的na值,并成功地将其反转。