Scrapy与cronjob在Ubuntu

g0czyy6m  于 2023-05-07  发布在  其他
关注(0)|答案(1)|浏览(143)

我试图从crontab运行我的名为seo_filter_pages的蜘蛛,但显然没有工作。我在Ubuntu工作。我创造了一个虚拟环境。scrapy的路径是/home/scrapy/venvScrapy/bin/scrapy,python和python3也在那里。蜘蛛路径:/home/scrapy/tufelka/tufelka/spiders/
尝试了使用PATH和不使用PATH,但什么都没有启动。下面是一个我试图写入crontab的示例。我做错了什么?我如何检查它是否有效?

  1. 05 00 * * * PATH=/home/scrapy/venvScrapy/bin && cd /home/scrapy/tufelka && scrapy crawl seo_filter_pages >> /home/scrapy/spider.log 2>&1
  2. 05 00 * * * * cd /home/scrapy/tufelka && /home/scrapy/venvScrapy/bin/scrapy crawl seo_filter_pages >> /home/scrapy/spider.log 2>&1
    最后,我添加了一个日志文件来记录操作,但它没有显示,这意味着cron没有工作。时间是作为一个例子。在调试的时候我会检查更正的时间。
    我不想用布什文件。
qjp7pelc

qjp7pelc1#

您只需要在运行scrapy二进制文件之前调用python二进制文件。
例如,您可以尝试:
05 00 * * * * (cd /home/scrapy/tufelka && /home/scrapy/venvScrapy/bin/python /home/scrapy/venv/Scrapy/bin/scrapy crawl seo_filter_pages) >> /home/scrapy/spider.log 2>&1
实际上,我不认为插入语有什么不同,这只是我个人的偏好。

相关问题