我想从StockTwits平台上发布的推文中获取一些信息。这里你可以看到一条示例推文:https://stocktwits.com/3726859/message/469518468我已经问过一次同样的问题(R How to web scrape data from StockTwits with RSelenium?),但是StockTwits网站已经更改,我无法再使用相同的html_nodes()
命令。因此,如果有人能帮助我输入html_nodes()
函数,我将非常高兴。
我想阅读以下信息:回复数、转发数、点赞数:
到目前为止,我已经做到了这一点:
library(rvest)
read_html("https://stocktwits.com/SunAndStorm/message/499613811") |>
html_nodes()
最终结果应该是一个 Dataframe ,如下所示:
# A tibble: 1 × 5
Reply Reshare Like Share Search
<lgl> <lgl> <lgl> <lgl> <lgl>
5 0 1 0 0
2条答案
按热度按时间ut6juiuv1#
我不使用html节点,而是使用xpath查找元素。
然后可以使用getelementtext查找信息
如果您需要帮助将此字符串转换为 Dataframe ,请告诉我,我可以帮助您,但我认为这不是主要问题。
种类
sczxawaw2#
在开发者工具中的网络部分,你会发现他们的API。用感兴趣的tweet ID调用它。
我在这里为你写了一个开始。我找不到重新分享和搜索。但我确信它在那里的某个地方。因为你有成千上万的推文来收集信息,这种方法更有效。
取消嵌套
comments
以查看注解