我正在emr集群中运行以下步骤:
./elastic mapreduce-j clusterid-jar s3n://mybucket/somejar
--main-class SomeClass
--arg -conf --arg 's3n://mybucket/configuration.xml'
someclass是hadoop作业,实现可运行接口。它读取configuration.xml作为参数,但是在上面的命令中someclass不能访问“s3n://mybucket/configuration.xml”(没有错误报告)。我尝试了“s3://mybucket/configuration.xml”,但也不起作用。我确信这个文件存在,因为我可以通过“hadoopfs-lss3n://mybucket/configuration.xml”看到它。对这个问题有什么建议吗?
谢谢,
1条答案
按热度按时间eit6fx6z1#
以下是可以尝试的选项
使用s3而不是s3n。
检查s3 bucket的访问权限。
您可以指定日志位置,并在作业失败后检查日志
elastic mapreduce--create--name“j\u flow\u name”--log uri“s3://your\u s3\u bucket”
它提供了更多的调试信息。
三。
有关更多详细信息,请参阅emr cli