下面的代码以前是可以工作的,但是我尝试下载文件的网站增加了一个用户验证步骤。我试过一些方法,包括让代码在循环步骤中休眠,但是到目前为止没有任何效果。有什么建议吗?
library(tidyverse)
library(rvest)
page <-
"https://burnsville.civicweb.net/filepro/documents/25657/" %>%
read_html
df <- tibble(
names1 = page %>%
html_nodes(".document-link") %>%
html_text2() %>%
str_remove_all("\r") %>%
str_squish(),
links = page %>%
html_nodes(".document-link") %>%
html_attr("href") %>%
paste0("https://burnsville.civicweb.net", .)
)
destfile<-("destination.pdf")
df %>%
map(~ download.file(df$links, destfile = paste0(df$names1, ".pdf")))
#loop through and download PDFs
for (i in df$links) {
tryCatch({
download.file(url,
basename(url),
mode = "wb",
quiet=TRUE)
}, error = function(e){})
}
先谢了!
1条答案
按热度按时间nnt7mjpx1#