我是一个全新的用r编写代码的人,我正在尝试将下面的表格整理成一个数据框架:
https://www.zyxware.com/articles/5363/list-of-fortune-500-companies-and-their-websites-2015
这应该是相当简单的,但我的变量有0个观察,我不知道我做错了什么。我使用的代码是:
library(tidyverse)
library(rvest)
#set the url of the website
url <- read_html("https://www.zyxware.com/articles/5363/list-of-fortune-500-companies-and-their-websites-2015")
#Scrape variables
rank <- url %>% html_nodes(".td:nth-child(1)") %>% html_text()
company <- url %>% html_nodes(".td:nth-child(2)") %>% html_text()
website <- url %>% html_nodes(".td~ td+ td") %>% html_text()
#Create dataframe
fortune500 <- data.frame(company,rank,website)
正试图遵循这个walkthrough。任何帮助都非常感谢:)
1条答案
按热度按时间wwtsj6pe1#
您可以通过在
url
上调用html_table()
并拾取第一个元素来完成此操作。创建于2023年3月1日,使用reprex v2.0.2
或者,你的原始代码也可以工作,你只需要删除
td
前面的句点。.
标识一个对象类,所以你试图标识类td
的对象。如果前面没有.
,它将查找名为td
的标签,这就是你想要的。创建于2023年3月1日,使用reprex v2.0.2