运行Scrapy Spider的多个示例

rdlzhqv9 于 2022-11-09 发布在其他

关注(0)|答案(1)|浏览(143)

我有成千上万个来自同一个域的URL（存储在MongoDB中），我需要使用Scrapy来抓取它们。问题是，蜘蛛抓取第一个URL，完成后再抓取第二个。我如何让它一次抓取多个URL，所有的URL都被并行抓取-独立地抓取？
我总是可以多次运行命令scrapy crawl <spidername>，但我正在寻找一个比这更复杂的解决方案。
欢迎提出实验性想法！

来源：https://stackoverflow.com/questions/34227119/running-multiple-instances-of-a-scrapy-spider

1条答案

按热度按时间

您可以在Spider的start_urls参数中加载Mongo中的所有url。Scrapy将从该列表中选择url并开始并行处理它们。

赞(0）回复(0）举报 2022-11-09

相关问题

热门标签

Java query python Node 开发语言 request Util 数据库 Table 后端算法 Logger Message Element Parser

最新问答

xxl-job 安全组扫描到执行器端口服务存在信息泄露漏洞
回答(1) 发布于 22天前
xxl-job 不能和nacos兼容？
回答(3) 发布于 22天前
xxl-job 任务执行完后无法结束，日志一直转圈
回答(3) 发布于 22天前
xxl-job-admin页面上查看调度日志样式问题
回答(1) 发布于 22天前
xxl-job 参数512字符限制能否去掉
回答(1) 发布于 22天前