自动设置多节点hadoop集群

gopyfrb3 于 2021-06-03 发布在 Hadoop

关注(0)|答案(2)|浏览(442)

我有一个安装了hadoop的ec2映像。但是，我在示例化时将其设置为无角色（它不是从机或主机）。为了启动hadoop集群，我在ec2上启动了我所需要的任意多个示例（节点），然后我必须对每个节点执行以下3项操作：
更新/etc/hosts以包含必要的ip地址。
如果是主节点，则更改$hadoop\u home/conf/masters和$hadoop\u home/conf/slaves
启用节点之间的ssh访问。
我希望能够找到一种方法来自动做到这一点，这样对于任意数量的节点，我就不必进去设置每个节点上的所有这些设置。
其他人如何处理自动设置hadoop集群的问题？有没有办法使网络部分自动化？
我不确定这是否可能，因为ip地址每次都会不同，但我想知道其他人尝试过什么或常用什么。有没有一种好的方法可以自动执行这些过程，这样每次设置集群进行测试时就不必对每个节点都执行这些操作？我对linux脚本不太了解，这是否可以通过脚本实现？或者我只需要手动配置每个节点？

hadoop amazon-ec2 configuration-management

来源：https://stackoverflow.com/questions/12896852/setting-up-multi-node-hadoop-cluster-automatically

2条答案

按热度按时间

wxclj1h51#

我想去看看是否有这样的实用程序存在，但找不到任何。
因此，我使用python、salt和fabric为“hadoop配置自动化”构建了一个自动化实用程序。
准备好hadoop集群需要很多步骤。
由ec2示例启动。
正在创建安全组。
设置ssh密钥，以便主示例可以ssh到从示例。
安装jdk。
安装hadoop。
将节点指定为namenode、secondary namenode、slaves-进行hadoop配置文件更改。。
启动服务
做所有这些，比如说4个节点需要1个小时。对于我想做的工作，我需要重复地做这些工作，而且经常需要大量的节点，因此需要自动化。
对于需要在每个节点中完成的步骤（例如：jdk安装、hadoop包安装等），我使用salt进行配置管理。salt提供类似于木偶和厨师的功能。
请随时退房https://github.com/varmarakesh/aws-hadoop
如果你已经有一个aws帐户，它是为方便安装和运行而设计的。

赞(0）回复(0）举报 2021-06-03

kpbwa7wx2#

我没有使用hadoop的经验，但一般来说，您的任务称为“配置管理”。一般来说，您编写一些“receipes”并为服务器定义“角色”（主、从）。这样的角色可能包含服务的配置文件、要安装的包、主机名更改、ssh密钥等。在服务器最初启动后，您可以告诉它们应该是哪个角色，它们将自动安装。
有不同的工具可用于这些任务，例如puppet或salt。维基百科上有一个比较。

赞(0）回复(0）举报 2021-06-03

我来回答

自动设置多节点hadoop集群

2条答案

相关问题

热门标签

最新问答