在Python中使用Selenium从网页的表中提取序列中的链接

lb3vh1jj 于 2023-01-26 发布在 Python

关注(0)|答案(1)|浏览(172)

我想在python中使用Selenium从此page中提取PDF的链接
我设法提取了包含行和PDF链接的整个表。

driver.get(company_link)
announcement_link = driver.find_element(By.XPATH, '//*[@id="heading1"]/h1/a').get_attribute('href')
driver.get(announcement_link)
table = driver.find_element(By.XPATH, '//*[@id="lblann"]/table/tbody/tr[4]/td')

我正在寻找一个最短的方法来创建一个序列中的所有pdf链接列表。我该怎么做呢？

selenium

来源：https://stackoverflow.com/questions/75197608/extracting-links-in-a-sequence-from-a-table-in-a-webpage-using-selenium-in-pytho

1条答案

按热度按时间

x9ybnkn61#

我想使用Python中的Selenium从该页面提取PDF链接
在您提供的页面中，每个链接都有一个唯一的类tablebluelink，这样就可以轻松地选择它们的所有href。XPath表达式选择所有a元素的href属性，这些元素具有值为tablebluelink的class属性：

//a[@class='tablebluelink']/@href

然后使用find_elements_by_xpath来迭代它们：

elems = driver.find_elements_by_xpath("//a[@class='tablebluelink']/@href")

赞(0）回复(0）举报 2023-01-26

我来回答

在Python中使用Selenium从网页的表中提取序列中的链接

1条答案

相关问题

热门标签

最新问答