我试图从亚马逊刮价格.它以前工作,但现在不,我不知道他们是否实施了一些保护,或者如果我没有正确使用rvest
.
的数据
我试着用这段代码:
library(rvest)
my_url <- "https://www.amazon.com/s?k=reusable+straws"
user_agent <- user_agent("Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:120.0) Gecko/20100101 Firefox/120")
my_session <- session(my_url, user_agent)
my_session %>%
html_elements(".a-offscreen")
字符串
我可以刮上面的<a class>
刚刚好,我可以刮下面的<span class="a-size-base a-color-secondary">
罚款,但没有一个价格跨度。
有什么想法吗?
1条答案
按热度按时间lymnna711#
考虑使用SelectorGadget等工具来更好地识别要抓取的正确HTML元素。
字符串