现在我已经安装了hadoop集群、hbase和hive。下一步我想设置cloudera impala来查询来自hbase或hdfs的数据。我在网上搜索,但找不到关于如何在hsdfs和hbase(可能在hive上)上设置cloudera impala的清晰易懂的说明,有人能给我一个关于在hdfs和hbase上设置和配置cloudera impala的指南吗?
6ju8rftf1#
首先,您的问题不清楚您是否安装了cdh或apachehadoop、hbase等。这一点很重要——虽然理论上它可以在股票hadoop上运行,但impala只在cdh上得到测试和支持。如果您没有安装impala或cdh,到目前为止最简单的方法是通过cloudera manager,它将自动安装/部署cdh/impala集群。cloudera express是免费的,它包含了您需要做的一切。您可以选择自动安装单个软件包,或者下载一系列linux软件包。这里详细描述了这些选项。或者,如果您只是想要一个演示,请下载并安装quickstart vm,它包含一个单节点集群(包括cdh+impala)、客户操作系统和数据/脚本/示例。以上任何内容的下载都可以在这里找到。
1条答案
按热度按时间6ju8rftf1#
首先,您的问题不清楚您是否安装了cdh或apachehadoop、hbase等。这一点很重要——虽然理论上它可以在股票hadoop上运行,但impala只在cdh上得到测试和支持。
如果您没有安装impala或cdh,到目前为止最简单的方法是通过cloudera manager,它将自动安装/部署cdh/impala集群。cloudera express是免费的,它包含了您需要做的一切。您可以选择自动安装单个软件包,或者下载一系列linux软件包。这里详细描述了这些选项。
或者,如果您只是想要一个演示,请下载并安装quickstart vm,它包含一个单节点集群(包括cdh+impala)、客户操作系统和数据/脚本/示例。
以上任何内容的下载都可以在这里找到。