如果resourcemanager关闭了怎么办?

kmpatx3s  于 2021-06-02  发布在  Hadoop
关注(0)|答案(1)|浏览(472)

在最新版本的hadoopmapreduce(称为'yarn')中,jobtracker(存在于以前的版本中)已被resourcemanager(称为'rm')和applicationmaster所取代。在有关yarn体系结构的官方文档中,没有文字说明一个mapreduce集群中有多少rm,给出的yarn体系结构图显示一个集群中只有1个rm。
所以,如果唯一的rm坏了怎么办?如果有多个rm,它们如何协同工作?
希望有人能给我解释一下。谢谢。

izkcnapc

izkcnapc1#

每个机架有一个ResourceManager,但您的群集中可以有多个机架。
如果您尝试在resourcemanager关闭时提交作业,hadoop将尝试连接到resourcemanager,因为它需要它来执行作业。
以下是rm关闭并尝试提交作业时的日志示例:

14/06/06 09:39:54 INFO ipc.Client: Retrying connect to server: hadoop01.sii.fr/10.6.6.211:8032. Already tried 1 time(s); retry policy is RetryUpToMaximumCountWithFixedSleep(maxRetries=10, sleepTime=1000 MILLISECONDS)
14/06/06 09:39:55 INFO ipc.Client: Retrying connect to server: hadoop01.sii.fr/10.6.6.211:8032. Already tried 2 time(s); retry policy is RetryUpToMaximumCountWithFixedSleep(maxRetries=10, sleepTime=1000 MILLISECONDS)
14/06/06 09:39:56 INFO ipc.Client: Retrying connect to server: hadoop01.sii.fr/10.6.6.211:8032. Already tried 3 time(s); retry policy is RetryUpToMaximumCountWithFixedSleep(maxRetries=10, sleepTime=1000 MILLISECONDS)

当rm返回时,作业正在正确提交。

相关问题