我正在对具有62个变量的 Dataframe 执行k均值聚类分析:点击数字1-62和75000列。我如何将 Dataframe 组织成单独的簇?
我使用 fviz_cluster 来可视化集群:
r_fit = kmeans(pressure_rotate, 5, nstart = 25)
fviz_cluster(r_fit,data = pressure_rotate)
并且我能够使用 r_fit$cluster 命令访问一个表,该表中的变量属于哪个簇,但是我如何重新组织数据,以便能够看到每个簇包含的内容呢?
cluster 1: Tapping number 3, Tapping number 5, Tapping number 12, ...
cluster 2: Tapping number 7, tapping number 9, ....
etc
1条答案
按热度按时间hivapdat1#
您有62行/观测值和75000列/变量。对吗?不是62个变量。不清楚“Tapping number”是数据中的一列还是仅仅是行号。下面是使用R中包含的
iris
数据的示例: