将数据从hadoop(本地)加载到azure数据湖的不同方法

vltsax25  于 2021-06-02  发布在  Hadoop
关注(0)|答案(1)|浏览(352)

我需要每8小时从hadoop(内部部署hortonworks集群)将数据加载到azure数据湖。你能让我知道-在实现解决方案的过程中可以尝试哪些不同的方法吗?
adf[我们可以创建一个管道活动并安排它们]还有什么吗?
谢谢,阿拉文

wfsdck30

wfsdck301#

我们在此链接提供了高级选项。搜索:“存储在内部部署或iaashadoop集群中的数据”。
但是,需要根据以下内容进行微调:1。要移动的数据量、文件数量、文件大小等。较小的文件传输时间较长。2从onprem到azure的网络连接如果您有可用的expressroute,您将有更好的体验。如果你只有公共互联网连接,你将被网络而不是你使用的工具所束缚。
谢谢,sachin sheth,azure数据湖项目经理。

相关问题