我试图只保留数据中一列的前4个单词,并且仍然希望保留少于4个单词的其他观察结果。
这是一些数据的示例。
| 国家|公司|工人人数|
| --------------|--------------|--------------|
| X|费尔菲尔德护理康复中心,|九九|
| Y轴|Athena健康|二十四|
| Z|DRS测试和能源管理,|一千零九|
| W|美式服装|三百七十六|
| C|BERRY PLASTICSPANY -ALENCE特种胶|六十七|
| A|Tuscaloosa资源,Swann的交叉矿|四五六|
我使用了以下代码
library(stringr)
df$Company1 <- word(df$Company, 1, 4)
虽然这是提供列的4个字的公司名称,这是不工作的我,因为它是摆脱的公司,有不到4个字返回NA的那些代替。
所以我希望找到一个解决方案,以保持每一个意见,有1至4个字。
1条答案
按热度按时间2uluyalo1#
你可以在下面这样做。
1.在
stringr
中使用str_split()
拆分Company
。1.用
apply()
粘贴每行1.删除右边的空白。
输出
创建于2023-04-28带有reprex v2.0.2