检查numpy数组中的每个元素是否在单独的列表中

h9vpoimq  于 2023-05-17  发布在  其他
关注(0)|答案(1)|浏览(103)

我想做这样的事情:

>>> y = np.arange(5)
>>> y in (0, 1, 2)
array([True, True, True, False, False])

这种语法不起作用。达到预期结果的最佳方法是什么?
(我在寻找一个通用的解决方案。显然,在这个特定的情况下,我可以做y < 3。)
我将为你们更清楚地说明这一点,因为至少有一些人似乎感到困惑。
要达到我想要的行为,还有很长的路要走:

new_y = np.empty_like(y)
for i in range(len(y)):
    if y[i] in (0, 1, 2):
        new_y[i] = True
    else:
        new_y[i] = False

我在寻找一种更紧凑的形式。
这里有另一个解决方案:

new_y = np.array([True if item in (0, 1, 2) else False for item in y])

再一次,只是寻找一种更简单的方法。

jtw3ybtb

jtw3ybtb1#

一个好的通用工具是两个数组的元素之间的广播或“外部”比较:

In [35]: y=np.arange(5)                                                         
In [36]: x=np.array([0,1,2])                                                    
In [37]: y[:,None]==x                                                           
Out[37]: 
array([[ True, False, False],
       [False,  True, False],
       [False, False,  True],
       [False, False, False],
       [False, False, False]])

这是在y的每个元素和x的每个元素之间进行快速比较。根据您的需要,您可以沿着其中一个轴压缩此数组:

In [38]: (y[:,None]==x).any(axis=1)                                             
Out[38]: array([ True,  True,  True, False, False])

一条评论建议in1d。我认为看看它的代码是个好主意。根据输入的相对大小,它有几种策略。

In [40]: np.in1d(y,x)                                                           
Out[40]: array([ True,  True,  True, False, False])
In [41]: np.array([True if item in x else False for item in y])                 
Out[41]: array([ True,  True,  True, False, False])

哪一个最快可以取决于输入的大小。开始列表你的列表理解可能会更快。这个纯列表版本是目前为止最快的:

[True if item in (0,1,2) else False for item in (0,1,2,3,4)] 
[item in (0,1,2) for item in (0,1,2,3,4)]    # simpler

相关问题