我有一个包含一些tweet的数据框,我想使用tidytext包的unnest_tokens()函数从tweet中提取hashtags,创建一个标记化的数据框,每个hashtags对应一行。
我的数据只有3列:
- Fecha:这是一个POSIXct变量类型的tweet日期。
- Usuario:这是数字变量类型的tweets的id用户。
- Texto:tweets在字符变量类型中的文本。
otros_numerales_numeral_petro <- Numeral_Petro_sin_emojis %>%
unnest_tokens(output = "hashtag", input = "Texto", token = "tweets") %>%
filter(str_starts(hashtag, "#"))
但是,当我运行代码时,我得到了这个错误:
错误:!对token = "tweets"
的支持在tidytext 0.4.0中被弃用,现在已不起作用。
有人能帮我修一下吗。
1条答案
按热度按时间42fyovps1#
是的,
token = "tweets"
选项在去年年底被弃用,因为上游依赖关系发生了变化。听起来你并不想对文本进行标记,而是提取所有的hashtag。我会这样做:创建于2023-04-01使用reprex v2.0.2