如何使用Scrapy抓取工具提示中显示的动态内容

ibps3vxo  于 2022-12-13  发布在  其他
关注(0)|答案(1)|浏览(149)

我想提取类“spcspc-nowrap”中的文本,使用scrapy和容器软件docker来抓取动态加载的内容。

<div id="tooltipdiv" style="position: absolute; z-index: 100; left: 637.188px; top: 625.609px; display: none;">
  <span class="help">
    <span class="help-box2 y-h wider">
      <span class="wrap-help">
        <span class="spc spc-nowrap" id="tooltiptext">
          text to extract
          <br>
          text to extract
          <strong>text to extract</strong>
          <br>
        </span>
      </span> 
    </span>  
  </span>
</div>

哪种xpath或css语法返回这些数据?

response.css("span#tooltiptext.spc.spc-nowrap").extract()

产生空列表

kmb7vmvb

kmb7vmvb1#

这应该会撷取所有文字,包括<strong>标签中的文字。
它将是一个列表,对于您的示例,输出将是:["text to extract", "text to extract", "text to extract"]

response.xpath('//span[@id="tooltiptext"]//text()').getall()

相关问题