如何将numpy.linalg.norm应用于矩阵的每一行?

6qfn3psc  于 2023-06-23  发布在  其他
关注(0)|答案(5)|浏览(90)

我有一个二维矩阵,我想取每行的范数。但是当我直接使用numpy.linalg.norm(X)时,它取整个矩阵的范数。
我可以通过使用for循环取每行的范数,然后取每一个X[i]的范数,但这需要大量的时间,因为我有30k行。
有什么建议可以找到一个更快的方法吗?或者是否可以将np.linalg.norm应用到矩阵的每一行?

ht4b089n

ht4b089n1#

对于numpy 1.9+

请注意,perimosocordiae shows,从NumPy版本1.9开始,np.linalg.norm(x, axis=1)是计算L2范数的最快方法。

对于numpy < 1.9

如果你正在计算L2范数,你可以直接计算它(使用axis=-1参数沿着行求和):

np.sum(np.abs(x)**2,axis=-1)**(1./2)

当然,Lp范数也可以类似地计算。
它比np.apply_along_axis快得多,尽管可能没有那么方便:

In [48]: %timeit np.apply_along_axis(np.linalg.norm, 1, x)
1000 loops, best of 3: 208 us per loop

In [49]: %timeit np.sum(np.abs(x)**2,axis=-1)**(1./2)
100000 loops, best of 3: 18.3 us per loop

norm的其他ord形式也可以直接计算(具有类似的加速比):

In [55]: %timeit np.apply_along_axis(lambda row:np.linalg.norm(row,ord=1), 1, x)
1000 loops, best of 3: 203 us per loop

In [54]: %timeit np.sum(abs(x), axis=-1)
100000 loops, best of 3: 10.9 us per loop
ercv8c1e

ercv8c1e2#

由于numpy更新而重新提出旧问题。从1.9版本开始,numpy.linalg.norm现在接受axis参数。[ codedocumentation ]
这是城里最快的方法:

In [10]: x = np.random.random((500,500))

In [11]: %timeit np.apply_along_axis(np.linalg.norm, 1, x)
10 loops, best of 3: 21 ms per loop

In [12]: %timeit np.sum(np.abs(x)**2,axis=-1)**(1./2)
100 loops, best of 3: 2.6 ms per loop

In [13]: %timeit np.linalg.norm(x, axis=1)
1000 loops, best of 3: 1.4 ms per loop

为了证明它在计算同样的东西:

In [14]: np.allclose(np.linalg.norm(x, axis=1), np.sum(np.abs(x)**2,axis=-1)**(1./2))
Out[14]: True
093gszye

093gszye3#

比公认的答案快得多的是使用NumPy的einsum

numpy.sqrt(numpy.einsum('ij,ij->i', a, a))

比这更快的是排列数据,以便跨所有 * 列 * 计算范数,

numpy.sqrt(numpy.einsum('ij,ij->j', aT, aT))

注意对数标度:

用于重现绘图的代码:

import numpy as np
import perfplot

rng = np.random.default_rng(0)

def setup(n):
    x = rng.random((n, 3))
    xt = np.ascontiguousarray(x.T)
    return x, xt

def sum_sqrt(a, _):
    return np.sqrt(np.sum(np.abs(a) ** 2, axis=-1))

def apply_norm_along_axis(a, _):
    return np.apply_along_axis(np.linalg.norm, 1, a)

def norm_axis(a, _):
    return np.linalg.norm(a, axis=1)

def einsum_sqrt(a, _):
    return np.sqrt(np.einsum("ij,ij->i", a, a))

def einsum_sqrt_columns(_, aT):
    return np.sqrt(np.einsum("ij,ij->j", aT, aT))

b = perfplot.bench(
    setup=setup,
    kernels=[
        sum_sqrt,
        apply_norm_along_axis,
        norm_axis,
        einsum_sqrt,
        einsum_sqrt_columns,
    ],
    n_range=[2**k for k in range(20)],
    xlabel="len(a)",
)
b.show()
b.save("out.png")
0s7z1bwu

0s7z1bwu4#

尝试以下操作:

In [16]: numpy.apply_along_axis(numpy.linalg.norm, 1, a)
Out[16]: array([ 5.38516481,  1.41421356,  5.38516481])

其中a是2D数组。
上面计算L2范数。对于不同的规范,您可以使用以下内容:

In [22]: numpy.apply_along_axis(lambda row:numpy.linalg.norm(row,ord=1), 1, a)
Out[22]: array([9, 2, 9])
qyuhtwio

qyuhtwio5#

就像这样简单,当你的2D numpy数组是x时:

x_unit = x / np.linalg.norm(x, axis=1, keepdims=True)

相关问题