scrapy 在大约727个刮擦页面后，刮擦蜘蛛返回错误429

zaq34kh6 于 2022-12-23 发布在其他

关注(0)|答案(1)|浏览(116)

我有一个Scrapy spider来抓取3,000个URL的列表。无论我抓取它们的速度是否缓慢（每秒0.8个站点）或稍快（每秒1. 5个站点），蜘蛛总是在刮取大约727个页面后开始失败，返回错误429。有趣的是，我已经打乱了URL，在我重新运行它的10次中，对于其中的3个项目，它恰好刮取了727个项目，其余时间大约为690-730，然后开始返回429个错误。
我使用头，随机代理和随机用户代理为每个请求。有人经历过这样的事情吗？

scrapy

来源：https://stackoverflow.com/questions/74880721/scrapy-spider-returning-error-429-after-around-727-scraped-pages