如何从下载链接按钮直接将CSV读入Pandas Dataframe ?

fdbelqdn  于 2022-12-06  发布在  其他
关注(0)|答案(1)|浏览(91)

我试图从链接地址直接读取 Train File 到Pandas Dataframe ,而不是下载到我的本地计算机然后阅读。
网址是:
https://datahack.analyticsvidhya.com/contest/practice-problem-loan-prediction-iii/download/#ProblemStatement
右键单击页面底部的 Train File 时,链接地址为:
https://datahack.analyticsvidhya.com/contest/practice-problem-loan-prediction-iii/download/train-file
我试探着:

import pandas as pd

url = 'https://datahack.analyticsvidhya.com/contest/practice-problem-loan-prediction-iii/download/train-file'
df = pd.read_csv(url)

错误为:

HTTPError: HTTP Error 403: Forbidden

我还尝试使用requests下载CSV,然后从我的本地计算机阅读它,但我也无法让它工作。

eqqqjvef

eqqqjvef1#

您需要提供您的登录凭据到网站。使用requests时,您可以将它们作为参数传入,如下所示:

response = requests.get(url, auth=HTTPBasicAuth(username, password))

用您的用户名和密码替换usernamepassword。它将验证请求并返回响应200,否则将返回错误403。
我也找到了这个answer,可能会有帮助。

相关问题