我一直在emr上试用impala,在我看来它只使用集群中的核心节点,而不是任务节点。我使用的是emr提供的内置impala安装,它是1.2.4。当我的群集中有任务节点时,它们会出现在impalad管理应用程序的“已知后端”列表中。但是在“查询”页面的“查询位置”下,它只显示集群中核心节点的主机名,而不是任务节点。这向我表明查询只在核心节点上运行。也许是因为hdfs只在核心节点上?有人能证实吗?如果是这样,有没有办法让它使用它们?为汤姆干杯
qxsslcnc1#
impala将只在核心节点(datanodes)上运行查询,因为每个impala进程直接读/写本地hdfs存储。这是 Impala 提高性能的方法之一。
1条答案
按热度按时间qxsslcnc1#
impala将只在核心节点(datanodes)上运行查询,因为每个impala进程直接读/写本地hdfs存储。这是 Impala 提高性能的方法之一。