pandas 从Azure Blob存储读取CSV文件,而不知道Python中的CSV文件名

oxiaedzo  于 2022-12-02  发布在  Python
关注(0)|答案(2)|浏览(117)

在Azure Blob存储中,我有CSV文件。我需要将这些CSV文件读入 Dataframe 。CSV文件名每次都不同。因此,我需要从Azure Blob存储容器文件夹中读取csv。文件夹名称不变,但csv文件名不同。

x0fgdtte

x0fgdtte1#

下面介绍如何将csv文件读取到 Dataframe

from azure.storage.blob import BlockBlobService
import pandas as pd
from io import StringIO

STORAGEACCOUNTNAME= "<YOUR_STORAGE_ACCOUNTNAME>"
STORAGEACCOUNTKEY= "<YOUR_STORAGE_ACCOUNT_KEY>"
CONTAINERNAME= "<YOUR_CONTAINER_NAME>"
BLOBNAME= "<BLOB_NAME>"

blob_service=BlockBlobService(account_name=STORAGEACCOUNTNAME,account_key=STORAGEACCOUNTKEY)

blobstring = blob_service.get_blob_to_text(CONTAINERNAME,BLOBNAME).content
df = pd.read_csv(StringIO(blobstring))
print(df)

结果:

参考文件:Explore data in Azure Blob storage with the pandas Python package

h79rfbju

h79rfbju2#

要解决这个问题,你可以考虑用通用名来命名CSV文件,这样就可以用通用名来调用它们。但是,既然你提到了CSV文件名的变化,我建议你只把CSV文件保存在容器中,然后用下面的代码来调用它:

file_loc = "wasbs://<continer name>@<storage account name>.blob.core.windows.net/*.csv
df = pd.read_csv(file_loc)

相关问题