如何绕过403禁止的错误与R下载.file

6ie5vjzr  于 2023-02-01  发布在  其他
关注(0)|答案(1)|浏览(138)

我试图从一个网站下载多个文件。我刮网站拿出单独的网址,但当我把网址的download.file,我得到一个403禁止错误。
看起来网站上有一个用户验证步骤,但是添加标题没有帮助。
任何帮助绕过这一点是赞赏。这里是我尝试与一个样本网址和文件:

headers = c(
  `user-agent` = 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/102.0.5005.61 Safari/537.36'
)

download.file("https://gibsons.civicweb.net/filepro/document/125764/Regular%20Council%20-%2006%20Dec%202022%20-%20Minutes%20-%20Pdf.pdf", 
              "file", 
              mode="wb", 
              headers=headers)```
63lcw9qa

63lcw9qa1#

网站似乎需要登录,您可以尝试使用RvestRSelenium等工具自动登录。成功登录后,您可以尝试再次下载文件。

相关问题