我不知道这是怎么发生的,但突然我的输出文件 hadoop reducer
包含一堆我从来没有写过的字符。前几行是这样的:
SEQ^F!org.apache.hadoop.io.LongWritable^Yorg.apache.hadoop.io.Text^@^@^@^@^@^@
<99><F1>a^O)(|7me<EB><C0><FB><E0><B2><E2>^@^@^@f^@^@^@^H^@^@^@^@^@^@^@^@]0 1.4593640091648059E-6 30 303761 30 303747 33 341837 30 303746 30 303743 30 312703 30 303759^@^@^@<8B>^@^@^@^H^@^@^@^@^@^@^@^@<8F><81>1
有人能帮忙吗?
提前谢谢
1条答案
按热度按时间dfty9e191#
这是一个二进制序列文件,您将其解释为文本。前3个字符是表示序列文件的“幻数”。然后您可以看到键和值类型(longwritable和text),接着是序列文件块头,然后是键/值对块(都是二进制编码的)。