仅检索Scrapy中的XML标记名

fnatzsnv  于 2022-11-23  发布在  其他
关注(0)|答案(1)|浏览(137)

短篇小说

如何在Scrapy中使用.xpath()只检索标记名称?

长时间

我目前正在使用一个Scrapy.Spider,并在parse()函数中使用response.selector.remove_namespaces()来保持简单。
我试着做这样的事情,但与Scrapy:
Iterate on XML tags and get elements' xpath in Python
然而,我似乎不知道如何只检索标签的名称。.xpath()命令是什么,只获取标签名称?

pgky5nke

pgky5nke1#

至少据我所知,没有一种内置的方法可以从scrapy.selector类中只提取标记名。
也就是说,您可以使用任何选择器的re方法,并使用正则表达式模式来提取标记名。
例如:

for selector in response.xpath("//*"):
    print(selector.re(r'<(\w+)\s'))

相关问题