numpy 表示预先计算的聚类的主成分分析

ttp71kqs 于 2023-06-29 发布在其他

关注(0)|答案(1)|浏览(78)

是否有一种方法可以对CSV文件中的一组变量进行主成分分析，同时使用不同颜色的预计算聚类进行绘图并标记其质心，如果这些属性是CSV文件的特定列。
假设我有数百个列，我想在其中执行PCA，我想为CSV文件的每个条目计算PC，但我想基于cluster_id列（0，1，2等）使用不同的颜色进行绘图，并使用不同于标准标记的标记标记来标记它们的质心。

numpy

来源：https://stackoverflow.com/questions/76571525/principal-component-analysis-representing-pre-computed-clusters

1条答案

按热度按时间

pxy2qtax1#

你可以使用seaborn或matplotlib来实现。用cluster_id给予一个数据框架：

import seaborn as sns
import matplotlib.pyplot as plt

fig = plt.figure(figsize=(12,9))
ax = sns.scatterplot(x=PCA_RESULTS[:, 0], y=PCA_RESULTS[:, 1] hue=data['cluster_id'], style=data['cluster_id'])

其中PCA_RESULTS是pca运行的前两个主成分，data ['cluster_id']是用于对散点图中的点着色的信息。style参数用于为每个集群id设置标记。

赞(0）回复(0）举报 2023-06-29

我来回答

numpy 表示预先计算的聚类的主成分分析

1条答案

相关问题

热门标签

最新问答