我是新手。我想知道如何获得特定集群的主题和该集群的文件名。i、 e这些文件与这些主题一起聚集到这个集群中。我听说有一个实用的clusterdumper可以完成这个任务。但我不知道怎么做。有人能举个例子来完成这项任务吗?
dgenwo3n1#
群集!=主题建模。假设你说的是k-means,集群会给你一个平均词频向量。对于终端用户来说,把这个主题变成一个有意义的主题是一项非常不同的任务,也是一项更具挑战性的任务。别以为马霍特会给你一个“美式足球”这样的好结果。不可能。没有人能在无人监督的情况下做这件事。
1条答案
按热度按时间dgenwo3n1#
群集!=主题建模。
假设你说的是k-means,集群会给你一个平均词频向量。对于终端用户来说,把这个主题变成一个有意义的主题是一项非常不同的任务,也是一项更具挑战性的任务。别以为马霍特会给你一个“美式足球”这样的好结果。不可能。没有人能在无人监督的情况下做这件事。