如何理解hadoop mapred.min.split.size和minsplitsize?

5n0oy7gb  于 2021-07-15  发布在  Hadoop
关注(0)|答案(1)|浏览(354)

在hadoop mapreduce中,在map阶段设置Map数量时,需要设置mapred.min.split.size,但是在查看官方文档时,还有一个参数是“minsplitsize”。两者有什么区别?

p5fdfcr1

p5fdfcr11#

首先,根据hadoop文档,“mapred.min.split.size”被弃用,取而代之的是“mapreduce.input.fileinputformat.split.minsize”。
然而,“mapred.min.split.size”用于在xml配置文件中配置hadoop集群,而“minsplitsize”用于fileinputformat类的setminsplitsize方法,用于直接在作业配置程序中设置值,具体到单个作业。
祝你好运

相关问题