我正在尝试从以下网站的所有颜色的表中获取数据:https://azdeq.gov/aq/ytd?year=2022&pollutant=pm25&location=pinal&type=conc#mtop
我是这么做的。
1.检查元素和发现表
1.复制表的XPath://*[@id=“节点-5748”]/格/格/格/格/格[5]
1.在这段简单的代码上花的时间比我希望的要多
1.表为空...使用css和选择器的结果相同
1.我已经使用了其他方法来访问一些数据,但是空白没有显示出来,也没有把东西扔掉。
任何帮助都将不胜感激。
library(rvest)
# Scrape the table from the website
table <- read_html("https://azdeq.gov/aq/ytd?year=2022&pollutant=pm25&location=pinal&type=conc#mtop") %>%
html_nodes(xpath='//*[@id="node-5748"]/div/div/div/div/div[5]') %>%
html_table()
1条答案
按热度按时间azpvetkf1#
问题是数据并没有存储在实际的HTML表中,而是存储在一堆div标签中,因此
html_table()
似乎无法解析这些数据,您可以自己进行一些处理。这将返回一个字符数组,但您可以将其强制转换为data.frame或任何其他类型。