有多种工具可以从hadoop访问数据。其中最受欢迎的是Hive和 Impala 。虽然impala是为了解决配置单元的批处理特性而构建的(对于低成本的sql),但impala不能完全消除mapreduce,因为它是处理批处理数据的一个非常好的框架。对于低成本的sqls,impala在跳过mapreduce作业时提供了非常好的性能。究竟是什么原因导致 Impala 比Hive快?是内存执行吗?或者是高效和智能地使用现有硬件(命名节点和数据节点)?
目前还没有任何答案,快来回答吧!
暂无答案!
目前还没有任何答案,快来回答吧!