我想在python中使用Selenium从此page中提取PDF的链接
我设法提取了包含行和PDF链接的整个表。
driver.get(company_link)
announcement_link = driver.find_element(By.XPATH, '//*[@id="heading1"]/h1/a').get_attribute('href')
driver.get(announcement_link)
table = driver.find_element(By.XPATH, '//*[@id="lblann"]/table/tbody/tr[4]/td')
我正在寻找一个最短的方法来创建一个序列中的所有pdf链接列表。我该怎么做呢?
1条答案
按热度按时间x9ybnkn61#
我想使用Python中的Selenium从该页面提取PDF链接
在您提供的页面中,每个链接都有一个唯一的类
tablebluelink
,这样就可以轻松地选择它们的所有href。XPath表达式选择所有a
元素的href
属性,这些元素具有值为tablebluelink
的class
属性:然后使用
find_elements_by_xpath
来迭代它们: