当一个作业的(#个缩减器)超过集群的容量时,预期会有什么性能损失?

mu0hgdu0  于 2021-06-02  发布在  Hadoop
关注(0)|答案(1)|浏览(319)

我在hadoop的配置文件中为每个节点配置(Map器/还原器的数量)。
我提交任何指定要使用的Map器/还原器的mr任务。
当作业的(#个减速器)超过集群的容量时,预期会有什么性能损失?

afdcj2ne

afdcj2ne1#

不能指定Map器的数目!

设置为运行的Map程序的数量完全取决于
文件大小
块大小
对于您的案例,没有直接的方法来估计性能损失。这取决于还原的类型,并且很大程度上取决于数据。
例如:假设您的数据是这样的,其中一个还原运行的时间太长,那么其他还原程序将完成并开始第二个还原作业。因此,当一个大的降价发生时,可能会完成所有的降价。

相关问题