mapreduce用于员工开始和结束时间,以找出哪个员工占用更多时间

d7v8vwbk  于 2021-06-02  发布在  Hadoop
关注(0)|答案(1)|浏览(233)

输入empmname |登录时间|注销时间
湿婆| 9.30 | 10.30
普拉萨德| 9.35 | 9.55
湿婆| 10.40 | 11.45
湿婆| 11.55 | 12.30
湿婆| 1.40 | 2.45
湿婆| 3.40 | 4.45
普拉萨德| 10.10 | 10.55
普拉萨德11.35 12.05
普拉萨德| 12.45 | 1.45
普拉萨德| 2.35 | 4.45
普拉萨德| 5.35 | 6.10
拉维9.00 9.55
拉维10.00 11.50
拉维1.05 1.20
拉维5.00 5.55
要求:
mapreduce程序来找出哪个用户停留的时间更长。

ca1c2owp

ca1c2owp1#

这似乎是一个考试中的问题,我不会告诉你代码,但逻辑应该是这样的:
获取字符串中的数据,根据“|”进行拆分,得到开始时间和结束时间的差值,并将其发送给减速机
在reducer中,添加单个员工对应的所有“time”
就这么简单。
顺便说一句,如果你想在hadoop上取得成功,你应该学会这样想

相关问题