hadoop2.0通过联邦架构提供了高可用性。通过上述体系结构实现了高可用性。
我对“资源经理”有疑问。
mrv2的基本思想是将jobtracker的两个主要功能(资源管理和作业调度/监视)拆分为单独的守护进程。其想法是拥有一个全局资源管理器(rm)和每个应用程序应用程序管理员(am)。应用程序要么是经典意义上的map reduce作业中的单个作业,要么是一组作业。
resourcemanager和每个节点的从属节点nodemanager(nm)构成了数据计算框架。resourcemanager是在系统中的所有应用程序之间仲裁资源的最终权威。
我们可以有资源管理器,而不是与名称节点共存。既然我们只有一个资源管理器,那么体系结构如何解决资源管理器的高可用性问题呢?
如果资源管理器关闭或不可用,会发生什么情况?
2条答案
按热度按时间t1qtbnec1#
在hadoop2.x.x中,hdfs和yarn都具有高可用性。
用于hdfs高可用性的namenode ha。
资源管理器ha(rmha)用于实现高可用性。
在rmha中,我们有一个主资源管理器(活动)和一个或多个备用资源管理器。这个资源管理器由zookeeper协调。如果活动资源管理器关闭,failovercontrol将启动故障转移,使其作为活动资源管理器备用。所以我们总是可以有活动的资源管理器。该概念避免了Yarn资源管理器中的单点故障(spof)。
http://www.cloudera.com/content/cloudera/en/documentation/core/latest/topics/cdh_hag_rm_ha_config.html#concept_xgs_pc5_vl_unique_1
9q78igpj2#
从hadoop v2.4+开始,这已经得到了修正。看看这里。