我怎样才能在不显示页面打开的情况下,使用selenium和chromedriver以及python来获取页面源代码呢?

jjhzyzn0  于 2023-01-12  发布在  Python
关注(0)|答案(3)|浏览(136)

我使用 selenium 与 chrome 驱动程序;我怎样才能获得页面源代码,而不显示页面打开?我应该在webdriver.ChromeOptions()中指定什么?下面是代码:

from selenium.common.exceptions import WebDriverException
from selenium.webdriver.chrome.options import Options

chrome_options = Options()
chrome_options.add_argument("???")
bowser = webdriver.Chrome(chrome_options=chrome_options)

browser = webdriver.Chrome() 
try:
    browser.get("www.google.com")
    html_content = browser.page_source
    #do stuff
    browser.quit()
except WebDriverException:
    print "Invalid URL"
sshcrbum

sshcrbum1#

您不应该使用ChromeDriver,而应该使用一些无头Webdriver,如HtmlUnitDriver,此处对此进行了说明

m4pnthwp

m4pnthwp2#

如果你坚持使用selenium,那么你可以使用任何一种headless浏览器,比如htmlunit driver,或者你可以只在URL上发送一个get请求,然后得到响应文本。

w6mmgewl

w6mmgewl3#

Selenium / Chrome有一个headless选项,允许您从代码加载网页:

from selenium.webdriver import Chrome
from selenium.webdriver.chrome.options import Options
chrome_options = Options()
chrome_options.add_argument("--headless")
browser = Chrome(options=chrome_options, executable_path='path_to_chromedriver')
browser.get('https://wwww.mywebsite.com')

相关问题