我想刮这个链接:https://www.magicbricks.com/property-for-sale/residential-real-estate?bedroom=&proptype=Multistorey-Apartment,Builder-Floor-Apartment,Penthouse,Studio-Apartment&cityName=Mumbai表示每个属性的链接。
HTML源代码中没有指向每个属性的各个页面的链接。页面的打开链接到一个事件。如何获得使用Scrapy和Playwright打开的页面的链接?
1条答案
按热度按时间vatpfxk51#
每个网站都是不同的,需要区别对待,通常旅程是从页面的元素面板开始的。
仔细查看一下你分享的url的元素面板,我们可以看到每张卡片都在一个div中,div还有一个脚本标签,里面有一个json,json确实有你要找的URL。
下面是提取URL的代码,您可以在page.evaluate function中运行这些URL。
下面是可以进入page.evaluate的代码的较短版本,