我试图从链接地址直接读取 Train File 到Pandas Dataframe ,而不是下载到我的本地计算机然后阅读。
网址是:
https://datahack.analyticsvidhya.com/contest/practice-problem-loan-prediction-iii/download/#ProblemStatement
右键单击页面底部的 Train File 时,链接地址为:
https://datahack.analyticsvidhya.com/contest/practice-problem-loan-prediction-iii/download/train-file
我试探着:
import pandas as pd
url = 'https://datahack.analyticsvidhya.com/contest/practice-problem-loan-prediction-iii/download/train-file'
df = pd.read_csv(url)
错误为:
HTTPError: HTTP Error 403: Forbidden
我还尝试使用requests
下载CSV,然后从我的本地计算机阅读它,但我也无法让它工作。
1条答案
按热度按时间eqqqjvef1#
您需要提供您的登录凭据到网站。使用
requests
时,您可以将它们作为参数传入,如下所示:用您的用户名和密码替换
username
和password
。它将验证请求并返回响应200,否则将返回错误403。我也找到了这个answer,可能会有帮助。