我试图从一个网站下载多个文件。我刮网站拿出单独的网址,但当我把网址的download.file,我得到一个403禁止错误。
看起来网站上有一个用户验证步骤,但是添加标题没有帮助。
任何帮助绕过这一点是赞赏。这里是我尝试与一个样本网址和文件:
headers = c(
`user-agent` = 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/102.0.5005.61 Safari/537.36'
)
download.file("https://gibsons.civicweb.net/filepro/document/125764/Regular%20Council%20-%2006%20Dec%202022%20-%20Minutes%20-%20Pdf.pdf",
"file",
mode="wb",
headers=headers)```
1条答案
按热度按时间63lcw9qa1#
网站似乎需要登录,您可以尝试使用
Rvest
或RSelenium
等工具自动登录。成功登录后,您可以尝试再次下载文件。