我有一个hadoop集群,有一个主节点和三个从节点。现在,我想在这个集群上添加apacheimpala功能。我从这里下载了tarball。我想建立 Impala ,但不知道什么是先决条件。有两种不同的来源:
这是来自docs的,它说需求是:mysql(或postgresql)、hivemetastore和java依赖(显然)。
这个 README.md
文件在 apache-impala
解开焦油球后创建的目录。引用它:
impala可以使用预先构建的组件构建,可以从s3下载,也可以使用位于thirdparty目录中的就地工具链构建(不推荐)。构建impala所需的组件有apachehadoop、hive、hbase和sentry。
我对这两个来源都感到困惑。我该怎么办?太好了!
1条答案
按热度按时间1sbrub3j1#
如果您仔细阅读impala需求,您将看到hadoop支持是隐含的,而sentry需求则隐藏在页面底部附近的impala安全链接中。
在java依赖项部分,它说:
所有java依赖项都打包在impala-dependencies.jar文件中,该文件位于/usr/lib/impala/lib/。这些Map到在fe/target/dependency下构建的所有内容。
查看相应的pom.xml,您将看到所有依赖项。变灰
artifactId
显示以下内容:因此readme.md正确地说明了您需要hadoop、hive、hbase和sentry来构建impala。