有没有可能在新服务器上打开Map器输出压缩 mapreduce 如果是的话,你能告诉我怎么做吗?我看到很多这样做的例子是基于 hadoop.mapred.JobConf 但没有人 mapreduce 应用程序编程接口。如果无法通过配置 new 我能做点什么让它工作吗?
mapreduce
hadoop.mapred.JobConf
new
btxsgosb1#
可以使用以下代码启用Map输出压缩:
public static void enableMapOutputCompress(Job job) { job.getConfiguration().setBoolean("mapred.compress.map.output", true); job.getConfiguration().setClass("mapred.map.output.compression.codec", SnappyCodec.class, CompressionCodec.class); }
你可以改变 org.apache.hadoop.io.compress.SnappyCodec 其他压缩类,例如: org.apache.hadoop.io.compress.GzipCodec , org.apache.hadoop.io.compress.LzoCodec .我建议使用snappycodec。
org.apache.hadoop.io.compress.SnappyCodec
org.apache.hadoop.io.compress.GzipCodec
org.apache.hadoop.io.compress.LzoCodec
1条答案
按热度按时间btxsgosb1#
可以使用以下代码启用Map输出压缩:
你可以改变
org.apache.hadoop.io.compress.SnappyCodec
其他压缩类,例如:org.apache.hadoop.io.compress.GzipCodec
,org.apache.hadoop.io.compress.LzoCodec
.我建议使用snappycodec。