pentaho水壶无法连接到cloudera cdh4 hdfs

kulphzqa  于 2021-06-03  发布在  Hadoop
关注(0)|答案(1)|浏览(444)

我使用的是pentaho数据集成工具(kettle pdi 5.0)和cloudera cdh4(ver 4.6)virtualbox单节点版本。
我正在尝试运行将数据加载到hdfs的教程。
但问题是我无法连接到cdh4hdfs:kettle向我显示了它无法连接到hdfs的错误。
我已经将active.hadoop.configuration配置为cdh42,并且正在从Windows8.1运行spoon.bat文件
如果有人知道如何设置连接,请提供帮助。

gdx19jrr

gdx19jrr1#

要配置到hadoop的连接,您需要在/plugins/pentaho big data plugin/hadoop configurations/your\u conf/中提供正确的配置文件。您至少应该提供core-site.xml。
然后您应该在/plugins/pentaho big data plugin/中编辑plugin.properties并设置 active.hadoop.configuration=YOUR_CONF .
我没有无缘无故地提到您的配置:很可能CDH4.2和4.6不兼容!因此,您必须创建自己的配置目录并为其提供库。其中大部分来自hadoop及其组件库文件夹,其他的由pentaho提供,比如pentaho hadoop和hadoop-*.jar。
另外,考虑阅读hadoop配置。

相关问题