scrapy 需要帮助找到一种方法来获得的东西形式与xpath()的头部

umuewwlo  于 2022-11-09  发布在  其他
关注(0)|答案(1)|浏览(117)

我知道如何获得响应。xpath('//head/script').getall()
问题是我必须从列表中得到一个特定的脚本,但无法找到如何执行。列表是随机的,所以不能只说list_foo[foo 1],因为它交换了它的位置,http头看起来像这样

head
    link rel="canonical" href=" /
    meta name="robots" content="noarchive" /
    script data-script="TagManagerDataLayer" .... /script
    script data-script="TagManagerScript" .... /script
    script ... /script
    script var item={} /script
    script ... /script
    /head

我需要刮除“var item={}”

jfgube3f

jfgube3f1#

您可以尝试以下操作://脚本[包含(.,“var项={}”)]

相关问题