我有一些关于生产级配置的问题。如果远程设置了hdfs:我必须在哪里安装配置单元,以便根据hdfs中的数据运行hql查询?在Hive中需要做哪些配置?metastore db将位于何处?如果我想安装sqoop,以便它可以从本地rdbms提取数据到远程hdfs,那么应该在哪里安装它?
oknrviil1#
配置单元服务器应安装在主节点上,如hdfs namenode和secondary namenode(参见此示例模式http://pivotalhd.docs.pivotal.io/docs/01-rawcontent/getting-started/phd2_typical_cluster_topology.png). 但你也需要安装Yarn。sqoop通常安装在客户机(边缘)节点上。如果您使用hortonworks或cloudera这样的发行版,它们包含一个带有向导的管理器,以简化所有服务(如hive、yarn、hbase等)的部署。
1条答案
按热度按时间oknrviil1#
配置单元服务器应安装在主节点上,如hdfs namenode和secondary namenode(参见此示例模式http://pivotalhd.docs.pivotal.io/docs/01-rawcontent/getting-started/phd2_typical_cluster_topology.png). 但你也需要安装Yarn。
sqoop通常安装在客户机(边缘)节点上。
如果您使用hortonworks或cloudera这样的发行版,它们包含一个带有向导的管理器,以简化所有服务(如hive、yarn、hbase等)的部署。