selenium 使用pd.read_html读取当前页面

mctunoxg  于 2022-11-10  发布在  其他
关注(0)|答案(1)|浏览(163)

我正在尝试使用pd.read_html()来读取当前页面,我正在尝试使用Selify抓取该页面。
唯一的问题是,该网页并不包含表格,直到你按下几个按钮,使用Selenson按钮,然后表格就会显示出来。
因此,当我输入参数时:
Pd.read_html(‘html_string’)
它给了我一个错误。
有没有办法在按钮被点击后读入当前页面,而不只是将html字符串作为参数输入?
我也看过这方面的文档,但找不到任何帮助。
感谢您的阅读/回复

zkure5ic

zkure5ic1#

在更新源代码时,我会尝试传递页面源代码,而不是地址:

url = ...
button_id = ...
driver.get(url)
button = driver.find_element(by=button_id)
button.click()
...  # wait?

data = pd.read_html(driver.page_source)

相关问题