我有一个关于自定义项的问题。在配置单元查询中使用自定义项时,它是否以mapreduce方式处理数据?例如,当我使用函数avg时,hive是否转换mapreduce作业中的函数?最佳
ghg1uchk1#
在大多数情况下,配置单元查询将被转换为map/reduce作业(hbase表上的select*除外)。average(avg)是一个内置的聚合函数,不是udf,但是这个配置单元将在map/reduce作业中处理这两个函数。请注意,未来版本的hive可能会改进这一点(例如,请参阅这篇关于hivestinger计划的文章),但如上所述,目前主要是m/r
1条答案
按热度按时间ghg1uchk1#
在大多数情况下,配置单元查询将被转换为map/reduce作业(hbase表上的select*除外)。average(avg)是一个内置的聚合函数,不是udf,但是这个配置单元将在map/reduce作业中处理这两个函数。
请注意,未来版本的hive可能会改进这一点(例如,请参阅这篇关于hivestinger计划的文章),但如上所述,目前主要是m/r