使用distcp时,wasb协议是否支持内部部署?

kmbjn2e3  于 2021-05-29  发布在  Hadoop
关注(0)|答案(2)|浏览(304)

我想将我的工作负载从本地移动到azure blob。我可以使用distcp将工作负载移动到azure吗?因为它是blob,所以我将在目标参数中使用wasb。在这种情况下,wasb会起作用吗?

z0qdvdin

z0qdvdin1#

注意:distcp(分布式拷贝)是一个用于集群间/集群内大型拷贝的工具。它使用mapreduce实现其分发、错误处理和恢复以及报告。它将文件和目录列表展开为Map任务的输入,每个任务将复制源列表中指定的文件分区。
如果您有一个可以访问数据湖存储的hdinsight集群,那么可以使用hadoop生态系统工具(如distcp)将数据复制到hdinsight集群存储(wasb)或从hdinsight集群存储复制到数据湖存储帐户。本文提供了有关如何使用distcp工具的说明。
如果您想在azure blob之间传输数据,请参阅以下文章:
在windows上使用azcopy传输数据。
在linux上用azcopy传输数据。

qyuhtwio

qyuhtwio2#

如果你加上 fs.azure 属性设置为core-site.xml,然后您可以将任何与hadoop兼容的文件系统与azure进行distcp
有关示例,请参阅文档

相关问题