定义自定义键

unftdfkk  于 2021-06-03  发布在  Hadoop
关注(0)|答案(1)|浏览(444)
IDbb5d7b0afbe40651f54120e31eb7fdd6  SI|us_us-800148_Rachel%20Maddow|http://www.msnbc.com/rachel-maddow-show TI1393717980    FC10  **UAMozilla/5.0**(Macintosh; Intel Mac OS X 10_9_1) AppleWebKit/537.73.11 (KHTML, like Gecko) Version/7.0.1 Safari/537.73.11

我是英语初学者
Hadoop MapReduce 想找些指导吗
以上是1份样品记录。我有一个平面文件,里面有10000条类似的记录。如果我只想读 UAMozilla 从下一行开始,并计算其在文件中的出现次数。如何使用 MapReduce 在 java 。请帮助,因为我一直在寻找解决这几天没有运气!!!
衷心感谢!

qmelpv7a

qmelpv7a1#

使用相同的 WordCount hadoop示例附带的程序。而不是将整个单词作为键来发射,而是只从Map中发射uamozilla/5.0,1。
要从日志行中单独提取uamozilla/5.0,只需使用regex。

相关问题