我想实现一个ssis作业,它能够下载位于远程hadoop集群上的大型csv文件。当然,在hadoop系统上只有一个普通的ftp服务器不会公开hdfs文件,因为它使用本地文件系统。我想知道是否有一个ftp服务器实现坐在hdfs之上。我更喜欢这种方法,而不是必须将文件从hdfs复制到本地fs,然后让ftp服务器提供服务,因为我需要分配更多的存储空间。
blpfk2vs1#
我从一个按预期工作的开放源代码项目派生出来:https://github.com/jamesattard/maroodi
1条答案
按热度按时间blpfk2vs1#
我从一个按预期工作的开放源代码项目派生出来:https://github.com/jamesattard/maroodi