在Python中使用Selenium从网页的表中提取序列中的链接

lb3vh1jj  于 2023-01-26  发布在  Python
关注(0)|答案(1)|浏览(172)

我想在python中使用Selenium从此page中提取PDF的链接
我设法提取了包含行和PDF链接的整个表。

driver.get(company_link)
announcement_link = driver.find_element(By.XPATH, '//*[@id="heading1"]/h1/a').get_attribute('href')
driver.get(announcement_link)
table = driver.find_element(By.XPATH, '//*[@id="lblann"]/table/tbody/tr[4]/td')

我正在寻找一个最短的方法来创建一个序列中的所有pdf链接列表。我该怎么做呢?

x9ybnkn6

x9ybnkn61#

我想使用Python中的Selenium从该页面提取PDF链接
在您提供的页面中,每个链接都有一个唯一的类tablebluelink,这样就可以轻松地选择它们的所有href。XPath表达式选择所有a元素的href属性,这些元素具有值为tablebluelinkclass属性:

//a[@class='tablebluelink']/@href

然后使用find_elements_by_xpath来迭代它们:

elems = driver.find_elements_by_xpath("//a[@class='tablebluelink']/@href")

相关问题