scrapy 临时链接Xpath选择

kcwpcxri 于 2022-11-09 发布在其他

关注(0)|答案(1)|浏览(165)

我在scrappy spider的parse方法中使用了下面的xpath选择器

for item in response.xpath(
         '//div[@id="mosaic-provider-jobcards"]//a//*[boolean(@id)]'
        ):
     print(item.get())

这将起作用，并为提取的每个项目返回以下文本

<span title="bla bla bla" id="1211">sdsd</span>

在循环中，我现在想提取title和id（即bla bla bla和1211），我尝试了以下代码，但没有成功

for item in response.xpath(
         '//div[@id="mosaic-provider-jobcards"]//a//*[boolean(@id)]'
        ):
        print(direct_page.xpath(".//title").get())

返回None，我希望它返回每个跨度的标题，我做错了什么？

scrapy

来源：https://stackoverflow.com/questions/72490120/scrapy-chained-xpath-selection

1条答案

按热度按时间

cld4siwp1#

使用@title

direct_page.xpath('//span/@title').get()

赞(0）回复(0）举报 2022-11-09

我来回答

scrapy 临时链接Xpath选择

1条答案

相关问题

热门标签

最新问答