namenode的高可用性与基于zookeeper的领导者选择

vwkv1x7d 于 2021-06-02 发布在 Hadoop

关注(0)|答案(1)|浏览(339)

我正在阅读apachehadoop文档和cloudera文档中的两个不同的内容。
基于cloudera，我们应该在高可用性模式下设置namenode，即：通过定义主namenode和次namenode，但是基于hadoop文档，这应该由zookeeper自动处理，它应该在可用的datanode中决定namenode。
有人能解释一下区别吗？用哪一个？

hadoop hdfs apache-zookeeper

来源：https://stackoverflow.com/questions/46414601/namenode-with-high-availability-vs-zookeeper-based-leader-selection

1条答案

按热度按时间

jtjikinw1#

通过定义主要和次要namenode
有这样一种东西作为“次要namenode”，但它实际上是一个非常不同的东西，因为它不是一个备用的，能够成为活动的。
没有“vs”。namenode ha需要zookeeper
如果你阅读了更多的cloudera文档，它一定会提到zookeeper。
自动故障转移为hdfs部署添加了两个新组件：zookeeper仲裁和zkfailovercontroller进程（缩写为zkfc）。
cloudera并没有在hadoop核心函数之上打包太多额外的东西（如果有的话）。
关于你的问题。。。
这应该由Zookeeper自动处理
如果（手动）配置了hdfs zookeeper属性，zookeeper正在运行，并且活动namenode关闭，则故障转移是自动的。
在可用的数据节点中
该操作与datanodes无关

赞(0）回复(0）举报 2021-06-02

我来回答

namenode的高可用性与基于zookeeper的领导者选择

1条答案

相关问题

热门标签

最新问答