我在mapreduce作业中遇到问题,我希望输出文件的格式为 file-day-26
而不是 part-r-00000
.
我试着用这种方法来实现这一点 addNamedOutput
( MultipleOutputs
),但只能更改零件 part
.
在旧的api中,我看到用这个方法可以做到这一点 generateFileNameForKeyValue
( MultipleTextOutputFormat
),但是我不能使用旧的api,所以我想知道hadoop的新api中是否有这样的东西。
有人能帮我吗?
谢谢。
1条答案
按热度按时间zzwlnbp81#
尝试使用multipleoutputformat。
参考链接:https://www.inkling.com/read/hadoop-definitive-guide-tom-white-3rd/chapter-7/output-formats