我想在本地模式下运行整个mahout集群,这意味着我的输入将是本地文件系统,输出也是本地文件系统。
下面是我在hdfs中运行mahout集群所遵循的步骤。
mahout seq2sparse-i/mahout/seqinput/part-m-00000-o/mahout/o\ seqsparse-ow
mahout canopy-i/mahout/o_seqsparse/tfidf vectors-o/mahout/o_canopy-dm org.apache.mahout.common.distance.squareducliendistancemeasure-ow-t1 50-t2 25
mahout kmeans-i/mahout/o_seqsparse/tfidf vectors-o/mahout/o_kmeans-dm org.apache.mahout.common.distance.squaredueclideandistancemeasure-c/mahout/o_canopy/clusters-0-final-cd 0.1-ow-x 20-cl-k 10
现在我想在本地模式下这样。
mahout seq2sparse-i<本地文件系统输入文件路径>-o<本地文件系统输出文件路径>-ow
mahout canopy-i<tfidf-vectors\u file path>-o<o\u canopy\u output\u path>-dm org.apache.mahout.common.distance.squareduclideAndInstanceMeasure-ow-t1 50-t2 25
mahout kmeans-i<tfidf-vectors_file path>-o<o_kmeans_output_path>-dm org.apache.mahout.common.distance.squaredueclideandistancemeasure-c/mahout/o_canopy/clusters-0-final-cd 0.1-ow-x 20-cl-k 10
请帮我解决这个问题。提前谢谢。
暂无答案!
目前还没有任何答案,快来回答吧!