我想要一个计数器来检查最流行的标签。现在的问题是,每条tweet都可以有多个hashtag,在这种情况下,如何将hashtag设置为键?因为在每一次迭代中,我都有一个来自每个tweet的hashtag数组。我如何打破这个问题以适应map-reduce范式?
ohtdti5x1#
您可以在一个map调用中执行多个调用以写入/收集。在tweet中搜索所有hastag并迭代,每次调用write/collect
1条答案
按热度按时间ohtdti5x1#
您可以在一个map调用中执行多个调用以写入/收集。
在tweet中搜索所有hastag并迭代,每次调用write/collect