我已经把pentaho5 ee和 Impala 结合起来了。在我的模式中,维度值不是从事实表中收集的,因为事实表是一个巨大的表,计算它们需要很长时间。因为维度值来自维度表,所以mondrian编译了一个查询,按照这个顺序将维度表与事实表连接起来(即左边的维度表)。这样的查询速度很慢,我在cloudera网站上看到,如果在impala中进行连接,较大的表(事实表)必须在右边。
我确实比较了mondrian在impala中直接编译的查询,当我把事实表放在join的左边时,它要快得多。我的问题是:是否有mondrian/analyzer属性设置,我可以使用它来启用当前mondrian总是与左边的维度表连接的行为。另外,是否有一个针对pentaho的hadoop插件,您可以推荐它来提高pentaho和impala的性能?
暂无答案!
目前还没有任何答案,快来回答吧!