注意:我不想指定 YARN -hadoop中的队列名称:为distcp指定一个队列我经常使用 hadoop distcp 用于移动数据 HDFS 并希望有一个描述性的应用程序名称为这些工作。目前,所有的复制作业都只显示名称 "distcp" 在 Resource Manager 没有办法区分不同的工作。有没有办法改进?
YARN
hadoop distcp
HDFS
"distcp"
Resource Manager
1l5u6lss1#
像许多其他mr工具一样, hadoop distcp 也可以让你通过 mapred 属性使用 -Dmapred.property.name=property-value 所以当我使用
mapred
-Dmapred.property.name=property-value
hadoop distcp \ -Dmapred.job.name=billing_db.replicate \ -m 10 \ /user/hive/warehouse/billing_db.db/ \ s3a://my-s3-bucket/billing_db.db/
它看起来很漂亮 Resource Manager 用户界面参考文献hadoop:指定distcp的队列 Sqoop 用户指南:使用泛型和特定参数
Sqoop
1条答案
按热度按时间1l5u6lss1#
像许多其他mr工具一样,
hadoop distcp
也可以让你通过mapred
属性使用-Dmapred.property.name=property-value
所以当我使用它看起来很漂亮
Resource Manager
用户界面参考文献
hadoop:指定distcp的队列
Sqoop
用户指南:使用泛型和特定参数