使用在hdi中运行的python访问blob存储

roejwanj  于 2021-06-25  发布在  Pig
关注(0)|答案(1)|浏览(362)

我正在写一个pig嵌入的python脚本,它在hdinsights中启动并运行。
我试图向python部分添加一个条件块,用于检查blob存储中的路径(例如。wasb://container@account/path)并基于此检查更新变量。
似乎标准os.path.exists无法访问blob存储(或者我对文件路径使用了错误的格式)。有人在这方面运气好吗?

oalqel3c

oalqel3c1#

wasb是一个hdfs兼容的文件系统,因此hadoop和hadoop内部运行的东西(hive、mapreduce等)都知道如何使用它;python和其他操作系统的东西没有。
如果您知道hdinsight集群使用的默认存储帐户/容器,则可以使用https://github.com/azure/azure-sdk-for-python 检查容器中是否存在这样的blob。http://azure.microsoft.com/en-us/documentation/articles/storage-python-how-to-use-blob-storage/ 应该有关于使用它访问blob的信息。

相关问题