如何在apachemahout中组合两个相似性示例

ufj5ltwl  于 2021-05-30  发布在  Hadoop
关注(0)|答案(1)|浏览(331)

我是新来的Apachemahout和我有问题在头脑中,请纠正我,如果我错了。
假设我们有数据集并从数据集中计算出推荐,然后将结果显示给用户,当用户再次访问我们的站点时,我们将有新的数据集,因此我们必须根据新的数据集再次计算推荐。
我们可以通过组合两个数据集,即旧数据集和新数据集来实现这一点,但是由于我们已经对旧数据集进行了计算,如果我们把它们结合起来,那么我们在旧数据集上再次进行相同的计算,当数据增加时,这将成为一个问题,所以我想问,有没有其他方法可以做到这一点,而我认为的另一种方法是将两个数据集的相似性结合起来,因为推荐是基于相似性的,但我找不到这方面的任何东西。
请帮我解决这个问题,
谢谢

1hdlvixo

1hdlvixo1#

您希望在移动的数据窗口上计算建议。决定你的窗口和更新频率。如果您每天更新并且窗口为3个月,那么您将放弃每天最早的数据,并在每次更新时使用3个月的最新数据。

相关问题