链接https://www.tripadvisor.com/AttractionProductReview-g60750-d12086300-San_Diego_Whale_Watching_Cruise-San_Diego_California.html
我想从“期待什么”中得到文本,我试了很多方法,但我不能得到它。
link <- "https://www.tripadvisor.com/AttractionProductReview-g60750-d12086300-San_Diego_Whale_Watching_Cruise-San_Diego_California.html"
webpage <- read_html(link)
webpage %>% html_node( '#\\:lithium-RmpiitkqlsnklaH1\\: .KxBGd' ) %>% html_text(trim = T)
webpage %>% html_nodes('[data-has-vuc|="true"]') %>% html_text(trim = T)
webpage %>% html_nodes("span.biGQs._P.pZUbB.KxBGd") %>% html_text(trim = T)
Any suggestion?
1条答案
按热度按时间uz75evzq1#
使用Chromote渲染页面并评估js以提取某些元素。可能不是最健壮的解决方案,可能需要一些调整,但它应该说明如何处理这样的问题。同样的javascript驱动策略也应该适用于(R)Selenium。
创建于2023-06-16带有reprex v2.0.2