我试图将密集矩阵操作移动到稀疏。我使用numpy广播将形状为(432,)的数组划分为(591,432),当它们是密集的时候,但是我如何对稀疏矩阵做这件事?
<591x432 sparse matrix of type '<class 'numpy.int64'>'
with 3876 stored elements in Compressed Sparse Column format>
<1x432 sparse matrix of type '<class 'numpy.int64'>'
with 432 stored elements in COOrdinate format>
字符串
当我尝试使用下面的虚拟数据时...
import numpy as np
from sklearn.feature_extraction.text import CountVectorizer
matrix = CountVectorizer().fit_transform(raw_documents=["test sentence.", "test sent 2.").T
max_w = np.max(matrix, axis=0)
matrix / max_w
型
我得到ValueError: inconsistent shapes
。我怎么能把这些分开呢?
1条答案
按热度按时间myzjeezk1#
如果你真的想,你可以除以乘以倒数。
字符串
但在您的情况下,与除以
B.todense()
相比,可能没有速度优势。型