scarpy redis减慢了项目管道的速度

vfh0ocws 于 2021-06-10 发布在 Redis

关注(0)|答案(0)|浏览(260)

我只是使用scrapy redis重新实现的dupfilter和调度器来支持从中断中恢复（redis只包含两个键-dmoz:dupfilter & dmoz:requests)，并使用一个项目管道在远程mongodb中存储项目。
但是，使用scrapy redis会减慢项目的处理速度，而不会影响请求和爬网的速度。当仅使用胶粘材料时，新零件的安装速度约为1000件/分钟；当使用scrapy redis时，它是0-4个项目/分钟。更具体地说，信息是在我按下ctrl-c时导出的，蜘蛛正在优雅地关闭，只处理剩余的项目，没有其他的赛车任务。
信息：抓取228页（47页/分钟），抓取7项（1项/分钟）
这不是一个新问题。我在scrapy redis的github页面中发现了一个问题，但是那里的建议不起作用（将scheduler\u idle\u before\u设置为接近0，但是引用源代码时默认为0）。https://github.com/rmax/scrapy-redis/issues/43
以下是我的一些设置：

LOG_LEVEL = 'DEBUG'

CONCURRENT_REQUESTS = 16

SCHEDULER_IDLE_BEFORE_CLOSE = 0

DUPFILTER_CLASS = 'scrapy_redis.dupfilter.RFPDupeFilter'

SCHEDULER = 'scrapy_redis.scheduler.Scheduler'

SCHEDULER_PERSIST = True

ITEM_PIPELINE = {
    'dmoz.pipelines.dmozPipeline': 300
}

感谢您的关注！

redis python web-crawler scrapy pyspider

来源：https://stackoverflow.com/questions/63026873/scarpy-redis-slows-down-item-pipelines

暂无答案！

目前还没有任何答案，快来回答吧！

我来回答

scarpy redis减慢了项目管道的速度

暂无答案！

相关问题

热门标签

最新问答