我发现了299篇文章之间的相似之处,但我需要一些帮助来创建包含20-30篇最相似文档的热图。
我试着用sns.heatmap,但没能画出来。我认为问题在于,他们试图用所有299个文档创建热图。
我该怎么办?请给出一些想法
from sklearn.metrics.pairwise import cosine_similarity
arr = cosine_similarity(tfidf_matrix_train, tfidf_matrix_train)
print(arr)
输出:
df_similar = pd.DataFrame(arr)
输出:
暂无答案!
目前还没有任何答案,快来回答吧!