scrapy 临时链接Xpath选择

kcwpcxri  于 2022-11-09  发布在  其他
关注(0)|答案(1)|浏览(158)

我在scrappy spider的parse方法中使用了下面的xpath选择器

for item in response.xpath(
         '//div[@id="mosaic-provider-jobcards"]//a//*[boolean(@id)]'
        ):
     print(item.get())

这将起作用,并为提取的每个项目返回以下文本

<span title="bla bla bla" id="1211">sdsd</span>

在循环中,我现在想提取title和id(即bla bla bla和1211),我尝试了以下代码,但没有成功

for item in response.xpath(
         '//div[@id="mosaic-provider-jobcards"]//a//*[boolean(@id)]'
        ):
        print(direct_page.xpath(".//title").get())

返回None,我希望它返回每个跨度的标题,我做错了什么?

cld4siwp

cld4siwp1#

使用@title

direct_page.xpath('//span/@title').get()

相关问题