有人能告诉我如何在python程序中打开和处理hdfs中的文件吗?谢谢
8yparm6h1#
您可以使用以下选项之一:https://code.google.com/p/libpyhdfs/https://github.com/traviscrawford/python-hdfs或者在没有外部lib的情况下执行类似操作:
file = subprocess.Popen(["hadoop", "fs", "-cat", "/path/to/file"], stdout=subprocess.PIPE) for line in file.stdout: print line
1条答案
按热度按时间8yparm6h1#
您可以使用以下选项之一:
https://code.google.com/p/libpyhdfs/
https://github.com/traviscrawford/python-hdfs
或者在没有外部lib的情况下执行类似操作: