hadoop distcp作业成功，但尝试被applicationmaster终止

0mkxixxg 于 2021-05-29 发布在 Hadoop

关注(0)|答案(1)|浏览(517)

在运行distcp作业时，我遇到了以下问题：几乎所有的map任务都被标记为成功，但注意到container killed。
在在线界面上，Map作业的日志显示：progress100.00 state succeeded
但在注意下，它说几乎每一次尝试（~200）容器都会被应用程序管理员杀死。容器被应用程序管理员杀死。按要求杀死集装箱。出口代码是143
在与尝试相关联的日志文件中，我可以看到一个日志，上面写着task'attempt\u\u 0'done。
对于所有作业/尝试，stderr输出为空。
在查看应用程序主日志并进行一次成功（但失败）尝试后，我发现以下日志：

2017-01-05 10:27:22,772 INFO [AsyncDispatcher event handler] org.apache.hadoop.mapreduce.v2.app.job.impl.TaskImpl: Task succeeded with attempt attempt_1483370705805_4012_m_000000_0
2017-01-05 10:27:22,773 INFO [AsyncDispatcher event handler] org.apache.hadoop.mapreduce.v2.app.job.impl.TaskImpl: task_1483370705805_4012_m_000000 Task Transitioned from RUNNING to SUCCEEDED
2017-01-05 10:27:22,775 INFO [AsyncDispatcher event handler] org.apache.hadoop.mapreduce.v2.app.job.impl.JobImpl: Num completed Tasks: 1
2017-01-05 10:27:22,775 INFO [AsyncDispatcher event handler] org.apache.hadoop.mapreduce.v2.app.job.impl.JobImpl: job_1483370705805_4012Job Transitioned from RUNNING to COMMITTING
2017-01-05 10:27:22,776 INFO [CommitterEvent Processor #1] org.apache.hadoop.mapreduce.v2.app.commit.CommitterEventHandler: Processing the event EventType: JOB_COMMIT
2017-01-05 10:27:23,118 INFO [RMCommunicator Allocator] org.apache.hadoop.mapreduce.v2.app.rm.RMContainerAllocator: Before Scheduling: PendingReds:0 ScheduledMaps:0 ScheduledReds:0 AssignedMaps:1 AssignedReds:0 CompletedMaps:1 CompletedReds:0 ContAlloc:1 ContRel:0 HostLocal:0 RackLocal:0
2017-01-05 10:27:24,125 INFO [RMCommunicator Allocator] org.apache.hadoop.mapreduce.v2.app.rm.RMContainerAllocator: Received completed container container_e116_1483370705805_4012_01_000002
2017-01-05 10:27:24,126 INFO [RMCommunicator Allocator] org.apache.hadoop.mapreduce.v2.app.rm.RMContainerAllocator: After Scheduling: PendingReds:0 ScheduledMaps:0 ScheduledReds:0 AssignedMaps:0 AssignedReds:0 CompletedMaps:1 CompletedReds:0 ContAlloc:1 ContRel:0 HostLocal:0 RackLocal:0
2017-01-05 10:27:24,126 INFO [AsyncDispatcher event handler] org.apache.hadoop.mapreduce.v2.app.job.impl.TaskAttemptImpl: Diagnostics report from attempt_1483370705805_4012_m_000000_0: Container killed by the ApplicationMaster.
Container killed on request. Exit code is 143
Container exited with a non-zero exit code 143

我已经设置了“mapreduce.map.estractive=false”！
所有的map任务都成功了（distcp job没有reduce），但是mapreduce运行了很长时间（几个小时），然后它成功了，distcp job就完成了。
我正在运行'yarn version'=hadoop 2.5.0-cdh5.3.1
我应该担心这个吗？是什么导致容器被杀死？如有任何建议，将不胜感激！

hadoop yarn DistCp

来源：https://stackoverflow.com/questions/41481531/hadoop-distcp-jobs-succeeded-but-attempt-xxx-killed-by-applicationmaster

1条答案

按热度按时间

zi8p0yeb1#

那些被杀的企图可能是由于投机性的处决。在这种情况下没有什么可担心的。
要确保是这样，请尝试这样运行distcp：

hadoop distcp  -Dmapreduce.map.speculative=false ...

你应该停止看到那些被杀的企图。

赞(0）回复(0）举报 2021-05-29

我来回答

hadoop distcp作业成功，但尝试被applicationmaster终止

1条答案

相关问题

热门标签

最新问答