我正在使用hadoop,需要配置机架感知。有谁能给我一个关于它是如何工作的想法或教程吗?我正在使用hadoop1.2.1。
yeotifhr1#
由于您需要教程和指导,以下几个链接足以让您了解如何设置机架意识:http://docs.hortonworks.com/hdpdocuments/hdp2/hdp-2.3.0/bk_hdfs_admin_tools/content/ch05.htmlhttps://bigdataprocessing.wordpress.com/2013/07/30/hadoop-rack-awareness-and-configuration/希望这有帮助。
1aaf6o9v2#
在hadoop的上下文中,机架拓扑定义了机器在数据中心机架中的物理位置。结合传统的网络设计和机架顶部交换,我们可以从逻辑上推断机器之间在网络连接方面的距离。机器的物理位置也与其他问题有关,如电力基础设施,这对于理解系统中可能的故障域至关重要。在hadoop中,通过实现一个脚本来配置机架拓扑,当命令行上给出主机名或ip地址列表时,该脚本按顺序打印机器所在的机架。拓扑脚本的实现完全取决于管理员,它可以像一个具有硬编码的机器和机架名称列表的shell脚本一样简单,也可以像一个从关系数据库读取数据的c可执行文件一样复杂。最常见的脚本类型之一是使用机器到机架Map的csv文件。这里有一个例子http://wiki.apache.org/hadoop/topology_rack_awareness_scripts
2条答案
按热度按时间yeotifhr1#
由于您需要教程和指导,以下几个链接足以让您了解如何设置机架意识:
http://docs.hortonworks.com/hdpdocuments/hdp2/hdp-2.3.0/bk_hdfs_admin_tools/content/ch05.html
https://bigdataprocessing.wordpress.com/2013/07/30/hadoop-rack-awareness-and-configuration/
希望这有帮助。
1aaf6o9v2#
在hadoop的上下文中,机架拓扑定义了机器在数据中心机架中的物理位置。结合传统的网络设计和机架顶部交换,我们可以从逻辑上推断机器之间在网络连接方面的距离。机器的物理位置也与其他问题有关,如电力基础设施,这对于理解系统中可能的故障域至关重要。
在hadoop中,通过实现一个脚本来配置机架拓扑,当命令行上给出主机名或ip地址列表时,该脚本按顺序打印机器所在的机架。拓扑脚本的实现完全取决于管理员,它可以像一个具有硬编码的机器和机架名称列表的shell脚本一样简单,也可以像一个从关系数据库读取数据的c可执行文件一样复杂。最常见的脚本类型之一是使用机器到机架Map的csv文件。
这里有一个例子
http://wiki.apache.org/hadoop/topology_rack_awareness_scripts