有人知道实现的样子吗?我有一个猜测;如果我错了,请纠正我:
select
ENAME,SAL,dense_rank() over (order by SAL) DEN_RANK
from
EMP;
假设Hive正在做一系列的Map和简化的数据将在某个点排序 SAL
,对吧?。但是,数据可能足够大,可以分布在多个hdfs块上(是的,每个hdfs块都会被排序)。我假设hive-rank/densed\u-rank管理hdfs块迭代,以便它访问块的每一行,一行接着另一行(按顺序),以尊重秩顺序。这个假设正确吗?
暂无答案!
目前还没有任何答案,快来回答吧!