我已经在AmazonEC2的LinuxRHEL7.2示例中安装了Cloudera5.8。我已使用ssh登录,并尝试使用以下命令运行wordcount示例以测试mapreduce操作:
hadoop jar /opt/cloudera/parcels/CDH-5.8.0-1.cdh5.8.0.p0.42/lib/hadoop-mapreduce/hadoop-mapreduce-examples.jar wordcount archivo.txt output
问题是wordcount程序被阻塞了,它不会产生输出。仅提示以下内容:
16/08/11 13:10:02 INFO client.RMProxy: Connecting to ResourceManager at ip-172-31-22-226.ec2.internal/172.31.22.226:8032
16/08/11 13:10:03 INFO input.FileInputFormat: Total input paths to process : 1
16/08/11 13:10:03 INFO mapreduce.JobSubmitter: number of splits:1
16/08/11 13:10:04 INFO mapreduce.JobSubmitter: Submitting tokens for job: job_1470929244097_0007
16/08/11 13:10:04 INFO impl.YarnClientImpl: Submitted application application_1470929244097_0007
16/08/11 13:10:04 INFO mapreduce.Job: The url to track the job: http://ip-172-31-22-226.ec2.internal:8088/proxy/application_1470929244097_0007/
16/08/11 13:10:04 INFO mapreduce.Job: Running job: job_1470929244097_0007
然后在“运行作业”后被阻止。在此之后,我必须按ctrl+c取消阻止,它不会产生输出。
有人知道为什么吗?。我认为这可能是一个配置问题,我是新的数据节点等。
谢谢。
1条答案
按热度按时间sirbozc51#
看起来没有资源(Map或缩减器插槽),作业正在等待资源。您可以在上检查作业状态。