在aws上分别为mapper和reducer指定vm设置

zpf6vheq 于 2021-06-03 发布在 Hadoop

关注(0)|答案(1)|浏览(278)

我有一个关于amazon web服务上的elastic mapreduce的问题。你们中有人能设置以下环境参数吗
mapreduce.map/reduce.java.opts
问题是，当我在Map器和还原器的虚拟机中检查堆大小时，最大堆大小不受这些设置的影响。我通过在map/reduce代码中添加以下行来检查heapsize as：

runtime = Runtime.getRuntime();
System.out.println(runtime.maxMemory());

我使用带有以下参数的命令行界面设置它们：
-引导操作s3://elasticmapreduce/bootstrap actions/configure hadoop--args“-m，mapreduce.map.java.opts=-xmx1000m，-m，mapreduce.reduce.java.opts=-xmx3000m”
我在amazonemr上检查了hadoop的版本如下：1.0.3（我检查了tomwhite的参考书，它说启动hadoop0.21应该支持这些）
尽管可以设置子进程的vm设置（=mapper和reducer的设置相同->mapred.child.java.opts），但是这对于我的算法来说非常不方便，在我的算法中reducer必须存储一个大的hashmap，而mapper什么都不讲。
可能与这个问题有关：如果设置了不受支持的环境变量，是否可能得到警告。当我设置上述变量时，可以访问它们，但它们显然不被使用/支持( configuration.get(...) 返回我设置的值）

hadoop mapreduce amazon-web-services elastic-map-reduce

来源：https://stackoverflow.com/questions/18203886/specifying-vm-settings-for-mapper-and-reducer-separately-on-aws