从Google Drive阅读xlsx到Pandas而不下载它?

0yycz8jy  于 2023-06-20  发布在  Go
关注(0)|答案(1)|浏览(123)

我试图在不下载的情况下将xlsx文件读入pandas df,但我遇到了问题。
我已经尝试read_excel,同时解析与sheet_id的URL,但遇到了以下错误,阻止我。

url = f"https://docs.google.com/spreadsheets/d/{sheet_id}/export"
file_df = pd.read_excel(url, engine='openpyxl')

错误:

zipfile.BadZipFile: File is not a zip file

我有一个服务帐户作为身份验证(应该足够),不希望使用承载令牌作为解决方案like这建议。
任何帮助将不胜感激。

qxsslcnc

qxsslcnc1#

由于你的电子表格是托管在谷歌,你应该导出到所需的格式。csv:

df = pd.read_csv(f"https://docs.google.com/spreadsheets/export?id={sheet_id}&format=csv")

或xlsx:

df = pd.read_excel(f"https://docs.google.com/spreadsheets/export?id={sheet_id}&format=xlsx")

相关问题