poc:cloudera impala+hdfs+hbase在单独的集群上

tjjdgumg  于 2021-06-26  发布在  Impala
关注(0)|答案(2)|浏览(373)

我正在处理一个大数据系统架构。我知道impala可以对hdfs/hbase集群中存储的数据执行查询。
但是如果我有一个hdfs集群加上另一个集群来保存hbase数据呢。impala能够执行合并两个集群数据的查询吗?

hjzp0vay

hjzp0vay1#

我认为您还需要在hbase集群上安装impala。在两个集群之间连接数据可能不是一个好主意,因为您将遇到延迟问题。

66bbxpm5

66bbxpm52#

第一个hbase将其数据存储在hdfs中。所以我确信你的hbase集群上有hdfs。
当impala将数据读/写到hdfs时,它直接访问os级别的块。这就是为什么 Impala 这么快在这。当impala读取hbase数据时,它将成为一个使用其api的hbase客户机,而不是直接从磁盘读取hbase数据。
因此,hbase不必与impala安装在同一个集群上。但是,集群需要能够相互访问。

相关问题