hadoop发布版本

kninwzqo  于 2021-06-02  发布在  Hadoop
关注(0)|答案(2)|浏览(370)

我正试图找出hadoop的不同版本,看完这一页后我感到困惑。

Download
1.2.X - current stable version, 1.2 release
2.2.X - current stable 2.x version
2.3.X - current 2.x version
0.23.X - similar to 2.X.X but missing NN HA.
Releases may be downloaded from Apache mirrors.


问题:
我认为任何以0.xx开始的版本都意味着它是alpha版本,不应该在产品中使用,是这样吗?
0.23.x和2.3.x有什么区别?它提到它们相似但缺少namenode?高可用性?0.23和2.3之间是否存在相关性?是因为当他们开发代码时,pmc团队会说“伙计!它太不成熟了,应该从0开始,因为它们是同一个产品,所以我会保持数字不变?”
当我查看新hadoop的源代码时,我发现jobtracker类原来是一个伪类。我正在设想jobtracker和tasktracker,即mapreduce1将在hadoop的路线图上慢慢消失,在另一种情况下,mapreduce作业的接口可能保持不变,但是第二代hadoop(yarn)将用resourcemanager完全取代jobtracker和tasktracker的概念……等等。
抱歉,这个问题可能有点杂乱无章,因为我被版本号弄糊涂了。我想好后再修改这个问题。

wwodge7n

wwodge7n1#

首先:hadoopv1和v2(又名yarn)之间有一个主要的区别。v1的namenode和jobtracker被新的resourcemanager取代,以获得更好的可伸缩性。这就是为什么这两个都会在以后的发展中消失。
第二:0.x版本是微妙的,对alpha版本没有任何暗示:openssl是一个超过10年的0.9版本(en.wikipedia.org/wiki/openssl#major#version#u releases),尽管它被认为是一个事实上的标准或参考实现。许多《财富》500强企业都信任它。
hadoop也是如此。0.23版本是指hadoopv1的体系结构,它有v2实现(除了高可用性,因为namenode仍然是v1的)。所以0.23和2.3是差不多的,继续平行老化。他们将其命名为0.x,因为1.x已经在使用中。他们只是不想让1.x不断老化,以表明2.x才是发展的方向——只有在依赖1.x的体系结构的情况下,才可以使用0.x,但另一方面,他们希望从2.x当前的开发中得到一些小的改进。
下面的部分试图解释这一点,但也有点混乱:http://wiki.apache.org/hadoop/roadmap. 上面的部分做得更好:http://hadoop.apache.org/releases.html
希望这有帮助。。。

sbtkgmzw

sbtkgmzw2#

从下面的图片中你可以注意到hadoop2.6.2已经在2.71之后发布了
推理2.6到2.6.2是一个小的api更新,是向后兼容的。
2.6到2.7是一个主要的api更新,例如不向后兼容。有些api现在可能已经过时了。

参考hadoop路线图

相关问题