我知道理论上答案是随机的,但我想知道,如果你用row\u number()做窗口函数,并且在给定分区的order by column中有重复的值,结果还会一样吗?配置单元是否查看其他列以确定顺序(即使未指定)?
xxhby3vn1#
重复行的顺序不能保证,因为查询处理是在许多Map器和还原器中并行进行的,每个Map器和还原器的执行速度可能更快,也可能较慢,但并不总是相同的,这取决于集群和每个节点所涉及的负载。mapper的结果可能不会以相同的顺序处理,即使在单个reducer上也是如此。
1条答案
按热度按时间xxhby3vn1#
重复行的顺序不能保证,因为查询处理是在许多Map器和还原器中并行进行的,每个Map器和还原器的执行速度可能更快,也可能较慢,但并不总是相同的,这取决于集群和每个节点所涉及的负载。mapper的结果可能不会以相同的顺序处理,即使在单个reducer上也是如此。