在Azure Blob存储中,我有CSV文件。我需要将这些CSV文件读入 Dataframe 。CSV文件名每次都不同。因此,我需要从Azure Blob存储容器文件夹中读取csv。文件夹名称不变,但csv文件名不同。
x0fgdtte1#
下面介绍如何将csv文件读取到 Dataframe
from azure.storage.blob import BlockBlobService import pandas as pd from io import StringIO STORAGEACCOUNTNAME= "<YOUR_STORAGE_ACCOUNTNAME>" STORAGEACCOUNTKEY= "<YOUR_STORAGE_ACCOUNT_KEY>" CONTAINERNAME= "<YOUR_CONTAINER_NAME>" BLOBNAME= "<BLOB_NAME>" blob_service=BlockBlobService(account_name=STORAGEACCOUNTNAME,account_key=STORAGEACCOUNTKEY) blobstring = blob_service.get_blob_to_text(CONTAINERNAME,BLOBNAME).content df = pd.read_csv(StringIO(blobstring)) print(df)
结果:
参考文件:Explore data in Azure Blob storage with the pandas Python package
h79rfbju2#
要解决这个问题,你可以考虑用通用名来命名CSV文件,这样就可以用通用名来调用它们。但是,既然你提到了CSV文件名的变化,我建议你只把CSV文件保存在容器中,然后用下面的代码来调用它:
file_loc = "wasbs://<continer name>@<storage account name>.blob.core.windows.net/*.csv df = pd.read_csv(file_loc)
2条答案
按热度按时间x0fgdtte1#
下面介绍如何将csv文件读取到 Dataframe
结果:
参考文件:Explore data in Azure Blob storage with the pandas Python package
h79rfbju2#
要解决这个问题,你可以考虑用通用名来命名CSV文件,这样就可以用通用名来调用它们。但是,既然你提到了CSV文件名的变化,我建议你只把CSV文件保存在容器中,然后用下面的代码来调用它: