nutch(2.2.1)注入URL挂起

7tofc5zh  于 2021-06-09  发布在  Hbase
关注(0)|答案(1)|浏览(424)

**结束。**此问题需要详细的调试信息。它目前不接受答案。
**想改进这个问题吗?**更新问题,使其成为堆栈溢出的主题。

6年前关门了。
改进这个问题
我运行的是ubuntu14.04,我正准备让一个基本的nutch网络爬网运行,但没有结果。在本教程之后,我设置了以下构建块:
ubuntu 14.04版
hbase 0.90.4版
坚果2.2.1
解决方案4.3.1
如果确认hbase和solr都在运行,则填充 urls/seed.txt 文件。当我打电话的时候;

bin/nutch inject urls

我看到了下面的输出,然后看起来nutch挂起了。

InjectorJob: starting at 2014-06-09 23:38:49
InjectorJob: Injecting urlDir: urls/seed.txt

这个stackoverflow问题似乎与我的相似,但我并不支持代理,因此答案不适用。
如能帮助解决这个问题,我们将不胜感激。

f8rj6qna

f8rj6qna1#

ubuntu将hosts中的环回ip地址默认为127.0.1.1。hbase(根据本页)要求环回ip地址为127.0.0.1。
ubuntu /etc/hosts 默认情况下,文件包含(mycomputername是您的计算机名):

127.0.0.1   localhost
127.0.1.1   myComputerName

使用 sudo gedit /etc/hosts 按以下步骤更新主机文件:

127.0.0.1   localhost
127.0.0.1   myComputerName

重新启动ubuntu。nutch应该不会再在将url注入hbase时遇到麻烦了。

相关问题