hadoopmapreduce中的性能方法v类级变量

v64noz0r 于 2021-06-03 发布在 Hadoop

关注(0)|答案(2)|浏览(290)

这是一个关于map reduce步骤中可写变量的性能和分配的问题。这是一个减速机：

static public class MyReducer extends Reducer<Text, Text, Text, Text> {
      @Override
      protected void reduce(Text key, Iterable<Text> values, Context context) {
        for (Text val : values) {
            context.write(key, new Text(val));
        }
      }
}

还是性能更好：

static public class MyReducer extends Reducer<Text, Text, Text, Text> {
      private Text myText = new Text();
      @Override
      protected void reduce(Text key, Iterable<Text> values, Context context) {
        for (Text val : values) {
            myText.set(val);
            context.write(key, myText);
        }
      }
}

在hadoop权威指南中，所有示例都是第一种形式，但我不确定这是针对较短的代码示例，还是因为它更惯用。

hadoop mapreduce performance

来源：https://stackoverflow.com/questions/18281207/method-v-class-level-variables-in-hadoop-mapreduce