mahout附带了许多预定义的hadoop作业类(来自abstractjob的东西)。其中包括用于计算建议的作业(recommenderjob)。mahout还定义了用于测试这些建议的各种推荐评估器,但我不清楚如何使用hadoop以分布式方式运行这些。
是:运行推荐程序作业,然后将其输出输入到评估器中吗?我看了rmsrecommenterevaluatortest,但它似乎可以一下子完成所有事情,看起来不像hadoop的工作。
mahout附带了许多预定义的hadoop作业类(来自abstractjob的东西)。其中包括用于计算建议的作业(recommenderjob)。mahout还定义了用于测试这些建议的各种推荐评估器,但我不清楚如何使用hadoop以分布式方式运行这些。
是:运行推荐程序作业,然后将其输出输入到评估器中吗?我看了rmsrecommenterevaluatortest,但它似乎可以一下子完成所有事情,看起来不像hadoop的工作。
1条答案
按热度按时间1cklez4t1#
首先,我认为mahout中的推荐分为两部分:非分布式算法(来自taste)和分布式hadoop作业(并行和基于项的协作过滤)。rmseevaluator是非分布式的,不要认为它可以用于hadoop作业。
要评估mahout中的hadoop推荐作业,请看
您还可以编写一些脚本并将推荐结果下载到本地文件系统进行评估。