我想将tar.gz文件从web直接提取到hdfs中。跳过下载到本地磁盘阶段,因为文件可能非常大。这一切都来自简单的命令行脚本(bash、wget等)
rmbxnbpk1#
好吧,看起来这个班轮很管用:
wget -O - http://...tar.gz | tar xfz - --to-stodout | hadoop dfs -put - /somepath
1条答案
按热度按时间rmbxnbpk1#
好吧,看起来这个班轮很管用: