我是Scrapy的新手。我刚刚上了一门课,写了代码,并在某种程度上理解了它。我面临的问题是只缓存第一个表的数据。
我试过了这是密码。
from ast import parse
from fileinput import filename
import scrapy
class PostsSpider(scrapy.Spider):
name = "posts"
start_urls= [
'https://publicholidays.com.bd/2022-dates/'
]
def parse(self, response):
for post in response.css('table'):
yield{
'date' : post.css('td::text').getall()[0],
'day' : post.css('td::text' ).getall()[1],
'event' : post.css('tr td a::text').getall()[0]
}
当我爬这个:{"date": "21 Feb", "day": "Mon", "event": "Shaheed Day"}
如何获取表的所有数据?
2条答案
按热度按时间nimxete21#
在css元素的选择上有一点小问题。现在它工作的很好。你可以直接运行代码。
输出:
daupos2t2#