快速numpy花式索引

du7egjpx 于 2023-04-06 发布在其他

关注(0)|答案(4)|浏览(131)

我的numpy数组切片代码（通过花哨的索引）非常慢，目前是程序的瓶颈。

a.shape
(3218, 6)

ts = time.time(); a[rows][:, cols]; te = time.time(); print('%.8f' % (te-ts));
0.00200009

什么是正确的numpy调用，以获得由矩阵a的行'rows'和列'col'的子集组成的数组？（事实上，我需要这个结果的转置）

numpy

来源：https://stackoverflow.com/questions/14386822/fast-numpy-fancy-indexing

4条答案

按热度按时间

ws51t4hk1#

让我试着总结Jaime和TheodrosZelleke的优秀答案，并加入一些评论。
1.高级（花哨）索引总是返回一个副本，而不是视图。

a[rows][:,cols]意味着 * 两个 * 花哨的索引操作，因此创建并丢弃了一个中间副本a[rows]。方便且可读，但不是非常有效。此外，要注意[:,cols]通常从C-cont.源代码生成一个Fortran连续副本。
a[rows.reshape(-1,1),cols]是基于rows.reshape(-1,1)和cols是broadcast到预期结果的形状的事实的单个高级索引表达式。
1.一个常见的经验是，扁平化数组中的索引可能比花哨的索引更高效，因此另一种方法是

indx = rows.reshape(-1,1)*a.shape[1] + cols
a.take(indx)

或

a.take(indx.flat).reshape(rows.size,cols.size)

1.效率将取决于内存访问模式以及起始数组是C连续的还是Fortran连续的，因此需要进行实验。
1.只有在真正需要的时候才使用花哨的索引：基本切片a[rstart:rstop:rstep, cstart:cstop:cstep]返回一个视图（虽然不连续），应该更快！

赞(0）回复(0）举报 2023-04-06

s71maibg2#

令我惊讶的是，这种计算第一个线性1D索引的lenghty表达式比问题中提出的连续数组索引快50%：

(a.ravel()[(
   cols + (rows * a.shape[1]).reshape((-1,1))
   ).ravel()]).reshape(rows.size, cols.size)

UPDATE：OP更新了初始数组的形状描述，更新后的大小加速比超过99%：

In [93]: a = np.random.randn(3218, 1415)

In [94]: rows = np.random.randint(a.shape[0], size=2000)

In [95]: cols = np.random.randint(a.shape[1], size=6)

In [96]: timeit a[rows][:, cols]
10 loops, best of 3: 186 ms per loop

In [97]: timeit (a.ravel()[(cols + (rows * a.shape[1]).reshape((-1,1))).ravel()]).reshape(rows.size, cols.size)
1000 loops, best of 3: 1.56 ms per loop

**初始答案：**以下是成绩单：

In [79]: a = np.random.randn(3218, 6)
In [80]: a.shape
Out[80]: (3218, 6)

In [81]: rows = np.random.randint(a.shape[0], size=2000)
In [82]: cols = np.array([1,3,4,5])

时间方法1：

In [83]: timeit a[rows][:, cols]
1000 loops, best of 3: 1.26 ms per loop

时间方法二：

In [84]: timeit (a.ravel()[(cols + (rows * a.shape[1]).reshape((-1,1))).ravel()]).reshape(rows.size, cols.size)
1000 loops, best of 3: 568 us per loop

检查结果是否实际相同：

In [85]: result1 = a[rows][:, cols]
In [86]: result2 = (a.ravel()[(cols + (rows * a.shape[1]).reshape((-1,1))).ravel()]).reshape(rows.size, cols.size)

In [87]: np.sum(result1 - result2)
Out[87]: 0.0

赞(0）回复(0）举报 2023-04-06

yxyvkwin3#

如果你使用花哨的索引和广播来切片，你可以得到一些速度：

from __future__ import division
import numpy as np

def slice_1(a, rs, cs) :
    return a[rs][:, cs]

def slice_2(a, rs, cs) :
    return a[rs[:, None], cs]

>>> rows, cols = 3218, 6
>>> rs = np.unique(np.random.randint(0, rows, size=(rows//2,)))
>>> cs = np.unique(np.random.randint(0, cols, size=(cols//2,)))
>>> a = np.random.rand(rows, cols)
>>> import timeit
>>> print timeit.timeit('slice_1(a, rs, cs)',
                        'from __main__ import slice_1, a, rs, cs',
                        number=1000)
0.24083110865
>>> print timeit.timeit('slice_2(a, rs, cs)',
                        'from __main__ import slice_2, a, rs, cs',
                        number=1000)
0.206566124519

如果你从百分比的Angular 考虑，做一些事情快15%总是好的，但在我的系统中，对于你的数组大小，这将减少40 us的切片时间，很难相信240 us的操作会成为你的瓶颈。

赞(0）回复(0）举报 2023-04-06

hkmswyz64#

使用np.ix_，你可以用类似的速度来ravel/reshape，但代码更清晰：

a = np.random.randn(3218, 1415)
rows = np.random.randint(a.shape[0], size=2000)
cols = np.random.randint(a.shape[1], size=6)
a = np.random.randn(3218, 1415)
rows = np.random.randint(a.shape[0], size=2000)
cols = np.random.randint(a.shape[1], size=6)

%timeit (a.ravel()[(cols + (rows * a.shape[1]).reshape((-1,1))).ravel()]).reshape(rows.size, cols.size)
#101 µs ± 2.36 µs per loop (mean ± std. dev. of 7 runs, 10000 loops each)

%timeit ix_ = np.ix_(rows, cols); a[ix_]
#135 µs ± 7.47 µs per loop (mean ± std. dev. of 7 runs, 10000 loops each)

ix_ = np.ix_(rows, cols)
result1 = a[ix_]
result2 = (a.ravel()[(cols + (rows * a.shape[1]).reshape((-1,1))).ravel()]).reshape(rows.size, cols.size)

np.sum(result1 - result2)
0.0

赞(0）回复(0）举报 2023-04-06

我来回答

快速numpy花式索引

4条答案

相关问题

热门标签

最新问答