我想将amazons3中的文件位置作为参数传递给hadoop jar。该文件包含一个xml文件,我需要在map-reduce的驱动程序类中解析该xml文件。那么如何传递该位置呢?在哪里指定s3凭据?
vxqlmq5t1#
不能使用s3n位置运行mr作业。上传jar文件并输入到s3,然后运行它 elastic-mapreduce 如下所示:
elastic-mapreduce
elastic-mapreduce --jar s3://mybucket/mycode.jar \ --args "-D,mapred.reduce.tasks=0" --arg s3://mybucket/input \ --arg s3://mybucket/output
u4vypkhs2#
或者您需要在配置文件中设置s3凭据,例如 mapred-site.xml or core-site.xml 或者您可以使用自定义配置文件-conf传递以下参数 hadoop jar 命令看起来像 hadoop jar <jar_file_name> <class_name> -conf <custom_conf> <arguments> ```fs.s3n.awsAccessKeyIdAWS-IDfs.s3n.awsSecretAccessKeyAWS-SECRET-KEY
mapred-site.xml or core-site.xml
hadoop jar
hadoop jar <jar_file_name> <class_name> -conf <custom_conf> <arguments>
2条答案
按热度按时间vxqlmq5t1#
不能使用s3n位置运行mr作业。上传jar文件并输入到s3,然后运行它
elastic-mapreduce
如下所示:u4vypkhs2#
或者您需要在配置文件中设置s3凭据,例如
mapred-site.xml or core-site.xml
或者您可以使用自定义配置文件-conf传递以下参数hadoop jar
命令看起来像hadoop jar <jar_file_name> <class_name> -conf <custom_conf> <arguments>
```fs.s3n.awsAccessKeyId
AWS-ID
fs.s3n.awsSecretAccessKey
AWS-SECRET-KEY