我有一个cloudera集群正在运行。我目前正在编写一个python应用程序,它查询api以获得响应。我将此响应写入应用程序中的文本文件。但是,我还希望在应用程序中以编程方式将此文本文件导出到cloudera集群。这可能吗?你能给我指一些参考资料或样本代码来实现这一点吗?或者只是你的想法和建议。谢谢!
bprjcwpo1#
您可能希望看看spotify的snakebite项目,它提供了一种通过python直接使用hdfs的方法。http://spotify.github.io/snakebite/
from snakebite.client import Client client = Client("localhost", 54310, use_trash=False) for x in client.ls(['/']): print x
1条答案
按热度按时间bprjcwpo1#
您可能希望看看spotify的snakebite项目,它提供了一种通过python直接使用hdfs的方法。http://spotify.github.io/snakebite/