我正在尝试从网页中提取urlToBeCaptured和要捕获的文本。结构如下所示:
<li>
" text with trailing spaces "
<a href="urlToBeCaptured">
<span class ="class1> Text to be captured </span>
<span class ="class2> Another text </span>
</a>
...
</li>
我正在做以下工作,但似乎不起作用:
el = driver.find_element(By.XPATH, "//li[contains(text(),'text with trailing spaces')]")
一旦我找到了如何从class1中提取文本的元素,它应该是这样的吗?
textToBeCaptured = el.find_element(By.CLASS_NAME, 'class1').text
1条答案
按热度按时间dba5bblo1#
给定HTML:
要定位带有text ”text with trailing spaces“ 的节点,然后它是带有
class ="class1"
的后代<span>
,您可以使用以下locator strategies之一:contains()
:normalize-space()
:*注意:需要添加以下导入: