为什么一个mapreduce作业的本地字节写入值比其他作业大得多？

fivyi3re 于 2021-06-04 发布在 Hadoop

关注(0)|答案(1)|浏览(352)

我写了一个mapreduce进程，我发现一个reduce作业比其他作业慢（所有的map作业都完成了），然后我发现“写的本地字节”是：2159972481，大约是其他作业的十倍。这是什么意思？为什么？如何解决这个问题？谢谢。

hadoop mapreduce bigdata debugging

来源：https://stackoverflow.com/questions/27980809/why-one-mapreduce-job-local-bytes-written-value-are-much-bigger-than-others

1条答案

按热度按时间

就像@mbaxi说的，很可能是你的文件被扭曲了。Map输出中的记录使用散列函数分布在密钥上。因此，如果文件发生倾斜，那么reduce节点将比其他节点做更多的工作。有道理吗？

赞(0）回复(0）举报 2021-06-04

相关问题

热门标签

Java query python Node 开发语言 request Util 数据库 Table 后端算法 Logger Message Element Parser

最新问答

xxl-job 安全组扫描到执行器端口服务存在信息泄露漏洞
回答(1) 发布于 3个月前
xxl-job 不能和nacos兼容？
回答(3) 发布于 3个月前
xxl-job 任务执行完后无法结束，日志一直转圈
回答(3) 发布于 3个月前
xxl-job-admin页面上查看调度日志样式问题
回答(1) 发布于 3个月前
xxl-job 参数512字符限制能否去掉
回答(1) 发布于 3个月前