我正在尝试通过执行以下操作来测试hadoop流式处理作业的Map器和缩减器函数:
cat data.txt | python mapper.py | sort | python reducer.py
但是Map器的排序输出不正确。
he the 1
i 1
i dog 1
i like 1
i'm 1
i'm rob 1
i'm the 1
i the 1 ### this should be after "i like 1" ###
lazy 1
我让其他人在他们的机器上进行了测试,他们用相同的Map器函数和命令行执行得到了正确的输出。所以我的unix系统似乎出了问题。
如果这有帮助:
echo $TERM
> vt100
任何关于尝试什么或设置不同的建议都将不胜感激。谢谢
1条答案
按热度按时间2w2cym1i1#
你在这里有你的答案,是关于地点的。简而言之,你应该使用