配置多个Map器(multipleinput)

yfjy0ee7  于 2021-05-29  发布在  Hadoop
关注(0)|答案(0)|浏览(261)

我需要处理两个不同格式的文件。我正在考虑采用以下方法:

MultipleInputs.addInputPath(job,new Path(args[0]),TextInputFormat.class,MapperOne.class);
MultipleInputs.addInputPath(job,new Path(args[1]),TextInputFormat.class,MapperTwo.class);

如何在SpringHadoop中定义多个Map器?

<job id="wordcount-job"
  input-path="${wordcount.input.path:/user/input/word/}"
  output-path="${wordcount.output.path:/user/output/word/}" 
  mapper="org.apache.hadoop.examples.WordCount.TokenizerMapper1"
  reducer="org.apache.hadoop.examples.WordCount.IntSumReducer" />

请给我建议。

暂无答案!

目前还没有任何答案,快来回答吧!

相关问题