我是新的大数据和寻找一个好的平台来执行建议,聚类和分类。我知道mahout有很多算法可以做到这一点。另外,r本身作为一个非常好的分析工具,对实现这一点非常有帮助。因为我正在研究bigdata,如果我决定走这条路,我将使用r+hadoop(通过streaming/rhipe/rhadoop等)。考虑到所用语言(mahout和r中的java)在复杂性上的差异,我正在寻求性能、可伸缩性、易用性、成熟度等方面的比较。
htrmnn0y1#
mahout集成了多种算法,主要解决三个问题:(1)推荐(协同过滤算法)(2)聚类(3)分类r只是用来统计的,所以如果你想完成以上三项任务,mahout是一个很好的工具。顺便说一句,mahout是一个maven项目,所以您需要安装maven。
1条答案
按热度按时间htrmnn0y1#
mahout集成了多种算法,主要解决三个问题:(1)推荐(协同过滤算法)(2)聚类(3)分类
r只是用来统计的,所以如果你想完成以上三项任务,mahout是一个很好的工具。
顺便说一句,mahout是一个maven项目,所以您需要安装maven。