r-hadoop mapreduce中是否有类似于java mapreduce中的setup()和cleanup()的方法?我必须在启动所有reducer之前只运行一次代码的一部分,比如db调用。在使用r编写mapreduce代码时是否有这样的规定?
ve7v8dk21#
如果你说的是rmr2,那就没有了。如果你详细描述了你的用例,我可以试着想出一个替代方案,或者即使失败了也能学到一些东西。我假设这个db访问需要在map和reduce之间进行,但是理解db操作是否依赖于map阶段的输出以及reduce阶段是否依赖于db操作的结果是很重要的。从我的经验来看,这是一个非常独特的要求,在我看来,你必须用两种工作来解决它,一种是Map,一种是缩小。
1条答案
按热度按时间ve7v8dk21#
如果你说的是rmr2,那就没有了。如果你详细描述了你的用例,我可以试着想出一个替代方案,或者即使失败了也能学到一些东西。我假设这个db访问需要在map和reduce之间进行,但是理解db操作是否依赖于map阶段的输出以及reduce阶段是否依赖于db操作的结果是很重要的。从我的经验来看,这是一个非常独特的要求,在我看来,你必须用两种工作来解决它,一种是Map,一种是缩小。