我认为术语shuffle是指在一个序列中随机地重新排列元素[1]。因此,我第一次看到mapreduce中的shuffling时,我认为它试图将工作负载均匀地分配给节点,以达到负载平衡的目的。然而,在阅读了细节之后,我意识到这不是我想象的那样。这不是随机的,更像是 group by 在sql中。那么使用洗牌这个词的动机是什么呢?因为我是mapreduce的新手,所以我很可能只是错过了一些东西。我洗耳恭听。
group by
目前还没有任何答案,快来回答吧!
暂无答案!
目前还没有任何答案,快来回答吧!