在设置伪集群或全集群时,我们需要格式化data node来安装hdfs文件系统还是只需要格式化namenode。我问这个问题是因为,我在很多博客上读到过,hdfs将数据按顺序存储在硬盘上,它是一个抽象层,将数据存储在大数据块上,而不是主机文件系统提供的默认数据块大小的存储。如果我们不格式化datanode,那么hdfs的强大功能就不值一提了。
1rhkuytd1#
格式化和装载硬盘驱动器与格式化hdfs没有直接关系。从概念上讲,“格式化”的思想是相同的。但这两项任务是完全分开的,没有直接关系。hadoop format命令不会格式化或装载硬盘驱动器。硬盘驱动器应该已经格式化和安装。当您为hdfs运行format命令时,它正在准备namenode fsimage文件,以便它知道数据磁盘上所有存储块的位置。
1条答案
按热度按时间1rhkuytd1#
格式化和装载硬盘驱动器与格式化hdfs没有直接关系。从概念上讲,“格式化”的思想是相同的。但这两项任务是完全分开的,没有直接关系。
hadoop format命令不会格式化或装载硬盘驱动器。硬盘驱动器应该已经格式化和安装。当您为hdfs运行format命令时,它正在准备namenode fsimage文件,以便它知道数据磁盘上所有存储块的位置。