我正试图刮一个图像使用的R语言中的Ralger库。很遗憾,我得到了这个错误代码:URL中不支持方案。
示例:
library(ralger)
setwd("C:/images")
link= "https://fr.wikipedia.org/wiki/Robert_Jardillier"
images_scrap(link, imgpath = getwd(), extn = "jpg" )
Undefined Error: Error in download.file(img_urls_f[i], destfile = basename(img_urls_f[i]), : scheme not supported in URL '//upload.wikimedia.org/wikipedia/commons/thumb/3/38/Robert_Jardillier_1932.jpg/220px-Robert_Jardillier_1932.jpg'
[1] NA
1条答案
按热度按时间iqjalb3h1#
维基媒体资源是(一般?)链接,URL开头的
https:
部分。虽然它对浏览器完全有效,但它很容易混淆scraper,我们需要自己将该部分添加到请求中。ralger::images_scrap()
是相当固定的,需要一些尴尬的变通方法,但也有ralger::images_preview()
,只是列出图像,该列表可以在使用它下载之前“固定”:维基百科媒体资源也可以通过API收集,而无需抓取文章: