控制hadoop中的中间产物

nc1teljy 于 2021-06-03 发布在 Hadoop

关注(0)|答案(1)|浏览(370)

我想用hadoop控制map和reduce之间的中间结果。我想指定在Map后将这些结果复制到何处。我想选择的数据将减少。总之，我想在进程洗牌和排序之前得到map的结果，然后做我想做的事情。如果你有解决办法，请告诉我。
谢谢

hadoop mapreduce hadoop2 hadoop-partitioning hadoop-streaming

来源：https://stackoverflow.com/questions/24451732/control-intermediates-results-in-hadoop

1条答案

按热度按时间

cwtwac6a1#

您可以在特定Map程序获得inputsplit后处理数据。将逻辑指定为 map 功能。
我想指定在Map后将这些结果复制到何处
使用 Context java类和 FileSystem 刷新fs上的结果（本地、hdfs、ftp…）
我想选择的数据将减少
我想要Map的结果之前，进程洗牌和排序，并做我想要的
在您的计算机上指定逻辑 map 中的函数 Mapper 班

赞(0）回复(0）举报 2021-06-03

我来回答

控制hadoop中的中间产物

1条答案

相关问题

热门标签

最新问答