哪个类在hadoop源代码中将mapreduce作业连接到其数据集?

omqzjyyz  于 2021-06-02  发布在  Hadoop
关注(0)|答案(1)|浏览(288)

我已经读过这些课了 hadoop-common/src/util ,但找不到将作业与其数据集关联的类。
hadoop如何知道哪个map reduce作业与哪个数据集相关?

yebdmbv4

yebdmbv41#

这由输入格式决定。
更准确地说:每个mapreduce作业都被分配一个 org.apache.hadoop.mapreduce.InputFormat (见 org.apache.hadoop.mapreduce.Job#setInputFormatClass ),框架使用它来确定输入拆分(=输入“数据集”)。
你可以搜索钥匙 mapreduce.job.inputformat.class 为了检查您的工作中使用了哪些实现,当然还要设置自己的实现。

相关问题