我试图刮所有的产品上的一个全球速卖通页面的代码如下,但它只返回10第一产品.
当我期望它返回所有产品时,我尝试了下面的代码,因为CSS选择器选择了所有产品名称。Here is the picture.
AlPage <- "https://www.aliexpress.com/w/wholesale-running-shoes.html?SearchText=running+shoes&catId=0&g=n&initiative_id=SB_20230318171033&sortType=total_tranpro_desc&spm=a2g0o.home.1000002.0&trafficChannel=main"
url<-read_html(AlPage)
print(url)
alproduct_name<-html_nodes(url,".manhattan--title--24F0J-G, .cards--title--2rMisuY") %>% html_text2()
alproduct_name
我还检查了所有产品的类名,因为我认为它们可能有不同的类名,但它们都是相同的。
1条答案
按热度按时间pkbketx91#
我怀疑最初的网页只显示前10个结果,然后剩下的结果会随着用户向下滚动而动态加载,所以使用
rvest
很难做到这一点。下面是使用RSelenium
的方法:我还将html节点更改为h1。您找到的节点对我不起作用,但h1仍然从该页面中提取鞋子名称。
46个结果正确吗?