查找两个numpy数组之间的索引Map

4xrmg8kj  于 2022-12-29  发布在  其他
关注(0)|答案(2)|浏览(132)

numpy中有没有一种好方法来获取array1中每个元素在array2中的位置的元素级索引?
举个例子:

array1 = np.array([1, 3, 4])
array2 = np.arange(-2, 5, 1, dtype=np.int)

np.where(array1[0] == array2)
# (array([3]),)
np.where(array1[1] == array2)
# (array([5]),)
np.where(array1[2] == array2)
# (array([6]),)

我想做

np.where(array1 == array2)
# (array([3 5 6]),)

这样的事情可能吗?我们保证array1中的所有条目都可以在array2中找到。

o2gm4chl

o2gm4chl1#

    • 方法#1:**在此处使用np.in1d获取匹配发生位置的掩码,然后使用np.where获取这些索引位置-
np.where(np.in1d(array2, array1))
np.searchsorted(array2, array1)

请注意,如果array2没有排序,我们需要使用额外的可选参数sorter
样品运行-

In [14]: array1
Out[14]: array([1, 3, 4])

In [15]: array2
Out[15]: array([-2, -1,  0,  1,  2,  3,  4])

In [16]: np.where(np.in1d(array2, array1))
Out[16]: (array([3, 5, 6]),)

In [17]: np.searchsorted(array2, array1)
Out[17]: array([3, 5, 6])

运行时间测试-

In [62]: array1 = np.random.choice(10000,1000,replace=0)

In [63]: array2 = np.sort(np.random.choice(100000,10000,replace=0))

In [64]: %timeit np.where(np.in1d(array2, array1))
1000 loops, best of 3: 483 µs per loop

In [65]: %timeit np.searchsorted(array2, array1)
10000 loops, best of 3: 40 µs per loop
iezvtpos

iezvtpos2#

如果你的数组不是太大,这里有一个更简单的方法。

np.equal.outer(array1,array2).argmax(axis=1)

如果array1的大小为N,array2的大小为M,这将创建一个shape(N,M)的临时数组,因此,如果您的数组太大,内存无法容纳,则不建议使用上述方法。

相关问题