mapreduce作业已停止执行

zvms9eto  于 2021-06-02  发布在  Hadoop
关注(0)|答案(1)|浏览(384)

我想办一个 TeraSort 基于基准测试 Hadoop 集群。脚本正在工作,首先它处于运行状态,但几分钟后它就卡住了 Accepted 州和 FinalStatus 未定义。我想,这可能是一个资源问题,所以我修改了 yarn-site.xml 就像上面一样。

<property>
  <name>yarn.nodemanager.resource.memory-mb</name>
  <value>8192</value>
  <description>Amount of physical memory, in MB, that can be allocated for containers.</description>
</property>

<property>
  <name>yarn.scheduler.minimum-allocation-mb</name>
  <value>2048</value>
</property>

又是同样的问题。你也可以看到上面关于这个过程的一些图表。当作业的进度条为9-15%时,它停止。

yvfmudvl

yvfmudvl1#

请验证为这些参数设置的值:
yarn.scheduler.maximum-allocation-mb、mapreduce.map.memory.mb、mapreduce.map.java.opts、mapreduce.reduce.memory.mb、mapreduce.reduce.java.opts
从yarn.scheduler.minimum-allocation-mb开始,将其设置为512mb。这将帮助调度器以较小的增量为任务分配内存。
更新1:此链接有助于了解以下几点:https://www.mapr.com/blog/best-practices-yarn-resource-management
另外,根据您的环境设置输入拆分大小。为了获得最佳的读取性能,您的输入分割大小和块大小应该相同。

相关问题