我想在Windows7机器上运行nutch通过cygwin。
当我尝试爬行时,我无法通过喷油器阶段。
这是我得到的错误:
2016-03-09 13:42:45,454 ERROR util.Shell - Failed to locate the winutils binary in the hadoop binary path java.io.IOException: Could not locate executable null\bin\winutils.exe in the Hadoop binaries.
之后会导致nullpointerexception:
2016-03-09 13:42:46445错误crawl.injector-injector:java.lang.nullpointerexception at java.lang.processbuilder.start(processbuilder。java:1010)
刚过“将注入的url转换为爬网db条目”
有人知道如何克服这个错误吗?
1条答案
按热度按时间wz1wpwve1#
我想问题是nutch无法读取输入url种子文件(包含要爬网的url列表)。请检查文件路径是否正确。
希望这有帮助,
勒库克多