我正试着用knox来做我的mapreduce工作。以前,我没有使用knox,mapreduce的工作需要35秒。
但是在使用knox之后,我看到了一个额外的作业-templatoncontrollerjob首先执行,它将启动我原来的mapreduce作业,这实际上需要更多的时间-大约1分钟20秒!
我知道mapreduce作业现在是templetoncontrollerjob的子作业。
但是我怎样才能让它更快呢?
为什么templetoncontrollerjob要花这么长时间?
我正试着用knox来做我的mapreduce工作。以前,我没有使用knox,mapreduce的工作需要35秒。
但是在使用knox之后,我看到了一个额外的作业-templatoncontrollerjob首先执行,它将启动我原来的mapreduce作业,这实际上需要更多的时间-大约1分钟20秒!
我知道mapreduce作业现在是templetoncontrollerjob的子作业。
但是我怎样才能让它更快呢?
为什么templetoncontrollerjob要花这么长时间?
1条答案
按热度按时间ukxgm1gy1#
这是一个有趣的观察和问题。不幸的是,这是apachehive项目和templeton/webhcat的问题,而不是apacheknox的问题。knox只是代理webhcat api来提交作业。希望我能多帮点忙。