我正在使用python和hadoop流媒体。尽管进行了仔细的单元测试,错误还是不可避免地出现。当它们这样做时,hadoop只会给出以下错误消息:
java.lang.RuntimeException: PipeMapRed.waitOutputThreads(): subprocess failed with code 1
at org.apache.hadoop.streaming.PipeMapRed.waitOutputThreads(PipeMapRed.java:362)
at org.apache.hadoop.streaming.PipeMapRed.mapRedFinished(PipeMapRed.java:576)
...
这条消息对调试毫无帮助。
有没有办法从hadoop流媒体中的python脚本中获取信息错误?
1条答案
按热度按时间s8vozzvw1#
如果您有权访问正在运行的集群的jobtracker,则可以通过查找作业并查找失败的任务来访问脚本的stderr/stdout。