我在计算 count distinct 没有分组,运行非常慢。所以我想知道这个功能是如何在hive中实现的,有没有 UDAFCountDistinct 为了这个?
count distinct
UDAFCountDistinct
2lpgd9681#
hive1.2.0+为count(distinct)提供自动重写优化。检查此设置:
hive.optimize.distinct.rewrite=true;
1条答案
按热度按时间2lpgd9681#
hive1.2.0+为count(distinct)提供自动重写优化。检查此设置: