我希望在分布式模式下运行apachenutch crawl命令时能够指定Map器、缩减器和作业队列的数量。以下是我尝试过但不起作用的方法:
runtime/deploy/bin/crawl -D mapreduce.map.memory.mb=4000 -D mapreduce.reduce.memory.mb=2000 -D mapred.job.queue.name=some-queue -i -D solr.server.url=http://http://my-solr-server:8983/solr/my-collection -s /user/me/seed /user/me/crawl-dir 1
如何将hadoop参数传递给命令?
暂无答案!
目前还没有任何答案,快来回答吧!