我已经创建了输入文本文件test.txt,并将其作为/user/yogesh/input/test.txt放到hdfs中
在hdfs上创建输出路径为/user/yogesh/output
在local/home/yogesh/wordcount.jar上创建jar文件并从local提交mr job,如下所示: hadoop jar /home/yogesh/WordCount.jar WordCount /user/yogesh/Input/test.txt /user/yogesh/Output/output1
我有以下错误:
线程“main”中出现异常
org.apache.hadoop.mapreduce.lib.input.invalidinputexception:input path 不存在:hdfs:host/user/yogesh/wordcount.
hdfs:host/user/yogesh/ -是我的hdfs目录。我不明白为什么这个mr工作在hdfs中寻找代码,以及如何解决这个错误。
1条答案
按热度按时间uyto3xhc1#
尝试将类wordcount的名称package作为前缀,或者跳过该类,只使用jar、input、output,如下所示:
另外,确保
/user/yogesh/Output/output1
在执行此命令之前不存在。另外,请注意,您应该提供一个输入目录,而不是一个输入文件。hadoop将把指定目录中的所有文件作为输入。有关示例,请参见如何在此站点中运行wordcount示例。