在Python中使用Scrapy和Scrapy shell来刮这个网站的功能图像https://www.thrillist.com/travel/nation/all-the-ways-to-cool-off-in-austin,但它返回这个data:image/gif;base64,R0
而不是图像的源代码,我需要有人的帮助,如果任何一个告诉我的方式来修复这个问题,以获得图像的源代码
这是我的代码
Feature_Image = [i.strip() for i in response.xpath('//*[@id="main-content"]/article/div/div/div[2]/div[1]/picture/img/@src').getall()][0]
2条答案
按热度按时间uklbhaso1#
页面上最大的图片应该是桌面上的一张(-常识逻辑。那么为什么不试着像下面这样找到它的来源呢?
结果是该页面海报最大尺寸的来源:
ryoqjall2#
看起来这个标签有一个data-src属性来保存链接和一些图像属性,解析文本并提取第一部分就可以得到链接。
如果你想区分图像的类型,你可以手动添加
.jpg
到末尾。链接可以使用扩展名,也可以不使用扩展名。