我正在尝试使用python的Scrapy软件包来抓取足球运动员的数据。
https://www.example.com/players-我将其称为“主页”
这里有一个在联盟中打球的球员列表。要获得我在主页上查找的数据,我必须点击球员的名字,它会带我进入该球员的“概述”页面,其中有我需要的数据。要获得我想为第二个球员刮取的数据,我必须回到主页,点击第二个玩家的名字,然后刮取数据〉再次回到主页,点击第三个玩家的名字,以此类推。那么,我应该如何在Scrapy中完成这项任务呢?我应该使用scrapy.spider还是crawlspider?我该如何告诉scrapy我想进入一个特定的页面(玩家的概述页面),然后转到所有玩家列表所在的主页,这样我就可以重复相同的过程去找下一个玩家了?提前感谢!
1条答案
按热度按时间xmakbtuz1#
假设页面不是用javascript呈现的,scrappy将是一个很好的工具。
我建议阅读安装文档和教程,以大致了解它是如何工作的,从哪里开始以及如何开始一个新项目。
下面是蜘蛛的一个示例:
Installation docs
Scrapy Tutorial