wordcount未在cloudera中运行

xlpyo6sf  于 2021-05-29  发布在  Hadoop
关注(0)|答案(1)|浏览(331)

我已经在AmazonEC2的LinuxRHEL7.2示例中安装了Cloudera5.8。我已使用ssh登录,并尝试使用以下命令运行wordcount示例以测试mapreduce操作:

hadoop jar /opt/cloudera/parcels/CDH-5.8.0-1.cdh5.8.0.p0.42/lib/hadoop-mapreduce/hadoop-mapreduce-examples.jar wordcount archivo.txt output

问题是wordcount程序被阻塞了,它不会产生输出。仅提示以下内容:

16/08/11 13:10:02 INFO client.RMProxy: Connecting to ResourceManager at ip-172-31-22-226.ec2.internal/172.31.22.226:8032

16/08/11 13:10:03 INFO input.FileInputFormat: Total input paths to process : 1

16/08/11 13:10:03 INFO mapreduce.JobSubmitter: number of splits:1

16/08/11 13:10:04 INFO mapreduce.JobSubmitter: Submitting tokens for job: job_1470929244097_0007

16/08/11 13:10:04 INFO impl.YarnClientImpl: Submitted application application_1470929244097_0007

16/08/11 13:10:04 INFO mapreduce.Job: The url to track the job: http://ip-172-31-22-226.ec2.internal:8088/proxy/application_1470929244097_0007/

16/08/11 13:10:04 INFO mapreduce.Job: Running job: job_1470929244097_0007

然后在“运行作业”后被阻止。在此之后,我必须按ctrl+c取消阻止,它不会产生输出。
有人知道为什么吗?。我认为这可能是一个配置问题,我是新的数据节点等。
谢谢。

sirbozc5

sirbozc51#

看起来没有资源(Map或缩减器插槽),作业正在等待资源。您可以在上检查作业状态。

http://ip-172-31-22-226.ec2.internal:8088

相关问题