我是hadoop的新手,正在创建我的第一个mapreduce作业。但是在编写main method类时,我遇到了两个方法
setMapOutputKeyClass
setMapOutputValueClass
这两种方法只需要在Map器从reducer输出类型生成不同类型时使用。否则默认为 setOutputKeyClass()
以及 setOutputValueClass()
方法使用Map器和reducer的类型通用的类型进行设置。
我的疑虑是( setMapOutputKeyClass
以及 setMapOutputValueClass
方法):
为什么需要这两种方法?这样做的真正目的是什么?
如果reducer的输出类型与mapper的输出类型不同,那么使用这两种方法设置类型将做什么?
如果类型不同,其他事物会受到什么影响?
谢谢
暂无答案!
目前还没有任何答案,快来回答吧!