我创建了大文本文件(4GB),如下所示。
0 1 2 3 2 1
3 6 2 0 6 4
3 0 6 3 0 0
1 6 7 3 9 4
每行描述一个向量,每列表示向量的每个元素。每个元素用一个空格隔开。
现在,我想用apachemahout对所有向量执行k-means聚类,但收到了错误消息 "not a SequenceFile"
.
如何创建格式符合mahout要求的文件?
我创建了大文本文件(4GB),如下所示。
0 1 2 3 2 1
3 6 2 0 6 4
3 0 6 3 0 0
1 6 7 3 9 4
每行描述一个向量,每列表示向量的每个元素。每个元素用一个空格隔开。
现在,我想用apachemahout对所有向量执行k-means聚类,但收到了错误消息 "not a SequenceFile"
.
如何创建格式符合mahout要求的文件?
暂无答案!
目前还没有任何答案,快来回答吧!