关闭。这个问题需要更加突出重点。它目前不接受答案。**想改进这个问题吗?**通过编辑这篇文章更新这个问题,使它只关注一个问题。
四年前关门了。改进这个问题我想问一下什么是保证hadoop集群安全和安排定期备份的最佳方法。是否可以对namenode进行实时备份?如何设置备份节点?
5ssjco0h1#
@amar提供了一个解决方案来确保集群的高可用性。此外,您应该考虑如何最好地保护hadoop集群上的数据免受用户错误、逻辑损坏和灾难的影响,有不同的方法可以做到这一点。您可以编写使用hdfs快照和distcp来完成所需任务的脚本。如果您不想编写和维护脚本,可以使用cloudera bdr或talena等解决方案,它们提供非常全面的备份和灾难恢复功能。注意我为塔伦娜工作。
quhf5bfb2#
您可以设置一个辅助namenode,它将定期自动备份namenode。在namenode失败的情况下,可以使用辅助namenode重新生成namenode元数据。您还可以在集群中设置ha(高可用性),这样,如果namenode发生故障,集群将自动切换到ha期间创建的备用namenode。请在此处阅读更多有关ha的信息:http://hadoop.apache.org/docs/r2.3.0/hadoop-yarn/hadoop-yarn-site/hdfshighavailabilitywithnfs.html
2条答案
按热度按时间5ssjco0h1#
@amar提供了一个解决方案来确保集群的高可用性。此外,您应该考虑如何最好地保护hadoop集群上的数据免受用户错误、逻辑损坏和灾难的影响,有不同的方法可以做到这一点。您可以编写使用hdfs快照和distcp来完成所需任务的脚本。如果您不想编写和维护脚本,可以使用cloudera bdr或talena等解决方案,它们提供非常全面的备份和灾难恢复功能。注意我为塔伦娜工作。
quhf5bfb2#
您可以设置一个辅助namenode,它将定期自动备份namenode。在namenode失败的情况下,可以使用辅助namenode重新生成namenode元数据。
您还可以在集群中设置ha(高可用性),这样,如果namenode发生故障,集群将自动切换到ha期间创建的备用namenode。请在此处阅读更多有关ha的信息:http://hadoop.apache.org/docs/r2.3.0/hadoop-yarn/hadoop-yarn-site/hdfshighavailabilitywithnfs.html