hadoop输出文件无法识别的字符

f0brbegy  于 2021-06-03  发布在  Hadoop
关注(0)|答案(1)|浏览(441)

我不知道这是怎么发生的,但突然我的输出文件 hadoop reducer 包含一堆我从来没有写过的字符。前几行是这样的:

SEQ^F!org.apache.hadoop.io.LongWritable^Yorg.apache.hadoop.io.Text^@^@^@^@^@^@
<99><F1>a^O)(|7me<EB><C0><FB><E0><B2><E2>^@^@^@f^@^@^@^H^@^@^@^@^@^@^@^@]0 1.4593640091648059E-6 30 303761 30 303747 33 341837 30 303746 30 303743 30 312703 30 303759^@^@^@<8B>^@^@^@^H^@^@^@^@^@^@^@^@<8F><81>1

有人能帮忙吗?
提前谢谢

dfty9e19

dfty9e191#

这是一个二进制序列文件,您将其解释为文本。前3个字符是表示序列文件的“幻数”。然后您可以看到键和值类型(longwritable和text),接着是序列文件块头,然后是键/值对块(都是二进制编码的)。

相关问题