我的源文件以csv格式位于ftp服务器中。我想把这些文件导入hdfs以便进一步处理。我不知道如何获得这些csv文件。有人能帮我吗?
sqxo8psd1#
您可以将此过程分为两步,并将文件上载到hdfs。第一步:从ftp服务器下载文件并存储在本地。这应该有帮助:将文件从ftp服务器传输到本地unix服务器第2步:一旦你有了本地文件,你就可以使用hadoopfs-put将文件传输到hdfs。例子。如果文件名为temp.csv,则可以执行以下操作:
hadoop fs -put temp.csv $hadoop_path
1条答案
按热度按时间sqxo8psd1#
您可以将此过程分为两步,并将文件上载到hdfs。
第一步:从ftp服务器下载文件并存储在本地。这应该有帮助:将文件从ftp服务器传输到本地unix服务器
第2步:一旦你有了本地文件,你就可以使用hadoopfs-put将文件传输到hdfs。
例子。如果文件名为temp.csv,则可以执行以下操作: