我想和大家分享我们的案子。
我们有两个名称节点、一个活动名称节点和一个备用名称节点的hadoop集群。
一段时间后,我们注意到活动名称节点和辅助名称节点已关闭3天。
查看名称节点日志文件后,我们看到辅助名称节点已关闭1个月,而活动名称节点已关闭几个小时。
我们在活动名称节点日志上看到的另一个有趣的事情是名称节点堆大小问题,因为可能有些人知道,辅助名称节点实际上支持活动名称节点,但是辅助名称节点并不替换活动名称节点。
因此我们推测,active name节点失败的原因可能是因为active name节点没有从secondary name节点获得数据确认,也可能是因为active name节点消耗了大量jvm。
我将感谢您的帮助,以及您对我们案件的意见
暂无答案!
目前还没有任何答案,快来回答吧!