如何使用map reduce计算给定tweet集合中的所有hashtag?

5fjcxozz  于 2021-05-29  发布在  Hadoop
关注(0)|答案(1)|浏览(296)

我想要一个计数器来检查最流行的标签。
现在的问题是,每条tweet都可以有多个hashtag,在这种情况下,如何将hashtag设置为键?因为在每一次迭代中,我都有一个来自每个tweet的hashtag数组。
我如何打破这个问题以适应map-reduce范式?

ohtdti5x

ohtdti5x1#

您可以在一个map调用中执行多个调用以写入/收集。
在tweet中搜索所有hastag并迭代,每次调用write/collect

相关问题