-dmapred.job.name不能与s3 dist cp命令一起使用

rkue9o1l  于 2021-05-31  发布在  Hadoop
关注(0)|答案(1)|浏览(408)

我想用s3 dist cp将emr hdfs中的一些文件复制到s3 bucket中,我在“emr master node”中尝试了这个cmd:

s3-dist-cp -Dmapred.job.name=my_copy_job --src hdfs:///user/hadoop/abc s3://my_bucket/my_key/

此命令执行得很好,但当我在资源管理器ui中检查作业名称时,它显示如下: S3DistCp hdfs:///user/hadoop/**->**s3://my_bucket/my_key/ 然而,预期的作业名称应该是 my_copy_job 感谢您的帮助,!
注意:使用此选项运行hadoop distcp时 -Dmapred.job.name=my_copy_job ,它在rm ui中正确显示作业名称,但作业最终失败

0x6upsns

0x6upsns1#

s3-dist-cp 不支持 -D 在运行时设置的样式属性为 hadoop distcp 做。s3distcp只接受这里列出的一组有限的选项。除了由定义的这些选项之外 S3DistCp ,它接受工具接口的通用选项。
但是 JobName 不是其中之一。 JobName 在s3distcp代码中硬编码,不能重写。

相关问题