hadoop、mahout和cdh的版本匹配

jjjwad0x  于 2021-06-03  发布在  Hadoop
关注(0)|答案(2)|浏览(469)

我需要使用最新的mahout版本0.9(因为我需要使用所有分布式推荐算法)。为此,我应该使用哪个版本的hadoop?
在某些地方,hadoop2.20在mahout 0.9中不能很好地工作。因此,我可以使用mahout 0.9的hadoop最低版本是什么。
如果我使用的是cloudera(cdh),那么我应该使用什么版本来处理mahout 0.9。

dphi5xsq

dphi5xsq1#

cdh 4.x包括mahout 0.7
cdh 5.0.x包括mahout 0.8
cdh5.1.x发布后,很可能会包含mahout 0.9,但不要引用我的话
所有这些版本的mahout的默认版本都是针对hadoop1.x的,而不是针对2.x的。因此,答案是0.9实际上主要适用于较旧的hadoop版本,而您可以使用它的最低版本最多是1.x。
更高的版本(大约是0.8?)支持使用替代maven概要文件构建,该概要文件应该与hadoop2互操作。如果您愿意,您可以随时使用构建来获得一个可能与给定hadoop发行版的hadoop版本一起工作的版本。
因为CDH4.x甚至都是基于Hadoop2.x的,mahout 0.7的发行版中包含了一些打包更改,这些更改也使得它能够在Hadoop2上进行互操作。其他供应商也做了类似的事情,这些变化已经回到了上游。
因此,每个版本的cdh发行版都已经与其匹配的hadoop版本兼容,即使是基于hadoop2的版本。
cdh5.0.0基本上基于hadoop2.3。您可以在hadooprelease2.3.0版本中使用mahout 0.9,然后在集群上使用自己的mahout版本。

myzjeezk

myzjeezk2#

我们目前使用的是CDH5.0.x集群,但还需要对mahout 0.9进行一些修复和改进。
因此,我们用cdh5.1.snapshot版本的mahout 0.9打包jar程序集,并通过“hadoopjar”命令简单地执行它。
当然不能使用mahout 0.9命令行界面,但至少我们可以编写自己的作业。

相关问题