我正在从一个网站(Find Properties For Sale)中提取房产信息。我已经能够抓取第一页的数据。但是当我试图抓取下一页的数据时,我的代码复制了第一页的数据。我该如何纠正这个问题?下面是我的方法:
next_page = response.css("ul.pagination li.page-item a.page-link::attr(href)").get()
if next_page is not None:
next_page = response.urljoin(next_page)
yield scrapy.Request(next_page, callback = self.parse)
1条答案
按热度按时间wz8daaqr1#
您可以使用以下xpath表达式: