将文本文件转换为序列文件

zujrkrfu  于 2021-06-03  发布在  Hadoop
关注(0)|答案(0)|浏览(226)

我是hadoop和mahout的新手。我想知道如何将包含一组向量的简单文本文件转换为序列文件。我尝试了mr框架并将outputformat更改为sequencefileoutputformat,得到了以下输出
seqorg.apache.hadoop.io.textorg.apache.hadoop.io.text��.�乌夫�;�与�'�样本
那些模糊的字符是二进制的,因此无法读取,但我的问题是如何获得sample0 1 2 3 4,类似于sequencefile格式(二进制格式)。
我相信这可以通过改变mapper函数的输出来实现,但是我无法理解。
-谢谢你的时间。

暂无答案!

目前还没有任何答案,快来回答吧!

相关问题