在旧版本的hadoop库(即org.apache.hadoop.mapred.lib)中,有一个名为identitymapper的Map器的基本实现,它基本上将所有的键值对传递给一个reducer。
但是,我在更新版本的hadoop库(org.apache.hadoop.mapreduce.lib)中发现,它没有任何名为identitymapper的类(mapper的所有子类都可以在这里找到)。
我能知道identitymapper是更改了它的名称还是在新库中消失了吗?
如果答案是第二个,我能进一步知道为什么identitymapper会消失吗?这是否意味着我们可以在没有Map器的情况下链接多个还原器?
1条答案
按热度按时间new9mtju1#
我突然意识到。。。
简单的回答是:新的Map器是旧的identitymapper。
下面是一个较长的答案:
在旧库中,mapper是一个接口,其基本实现称为identitymapper。
但是,在新库中,它不再具有Map器的基本接口。相反,它有一个通用的Map器基类mapper,它的实现是前面的identitymapper。