我想提取类“spcspc-nowrap”中的文本,使用scrapy和容器软件docker来抓取动态加载的内容。
<div id="tooltipdiv" style="position: absolute; z-index: 100; left: 637.188px; top: 625.609px; display: none;">
<span class="help">
<span class="help-box2 y-h wider">
<span class="wrap-help">
<span class="spc spc-nowrap" id="tooltiptext">
text to extract
<br>
text to extract
<strong>text to extract</strong>
<br>
</span>
</span>
</span>
</span>
</div>
哪种xpath或css语法返回这些数据?
response.css("span#tooltiptext.spc.spc-nowrap").extract()
产生空列表
1条答案
按热度按时间kmb7vmvb1#
这应该会撷取所有文字,包括
<strong>
标签中的文字。它将是一个列表,对于您的示例,输出将是:
["text to extract", "text to extract", "text to extract"]