我尝试使用Scrapy从here中提取表“Comissões a que pertence / pertenceu”中的信息。
由于表的数量可以改变(并且我想提取几个等价页面的信息),所以我首先使用查找相关部分
for node in response.xpath('//*[@class = "ARLabel TextBold"]'):
texto = node.extract()
if u'Comissões a que pertence' in texto:
break
然后我试着通过以下方式找到所需信息的一部分:
node.xpath('.//*[@class = "ARTabResultadosLinhaImpar"]')
但是导致空列表。
编辑:已删除/text()
2条答案
按热度按时间mnemlml81#
您可以使用此Xpath:
编辑(获取表格):
如果这解决了您的问题,Mark会回答
798qvoo82#
可以使用
./
而不是//
see https://devhints.io/xpath来完成与所选节点的相对xpath。因此,您几乎就到了那里。而不是node.xpath('.//*[@class = "ARTabResultadosLinhaImpar"]')
应该是