hive——对于重复的order-by值,结果是否总是相同的?

pzfprimi  于 2021-06-27  发布在  Hive
关注(0)|答案(1)|浏览(400)

我知道理论上答案是随机的,但我想知道,如果你用row\u number()做窗口函数,并且在给定分区的order by column中有重复的值,结果还会一样吗?配置单元是否查看其他列以确定顺序(即使未指定)?

xxhby3vn

xxhby3vn1#

重复行的顺序不能保证,因为查询处理是在许多Map器和还原器中并行进行的,每个Map器和还原器的执行速度可能更快,也可能较慢,但并不总是相同的,这取决于集群和每个节点所涉及的负载。mapper的结果可能不会以相同的顺序处理,即使在单个reducer上也是如此。

相关问题