使用R给出以下等式:
County_or_City <- c("Butte County", "Oroville", "Solano Cnty", "Redding", "Maripossa county")
data.frame(County_or_City)
County_or_City
1 Butte County
2 Oroville
3 Solano Cnty
4 Redding
5 Maripossa county
我想创建一个新列,其中包含一个哑变量,用于包含县、县或县的行。对不起,我知道这是非常基本的,但我正在学习。我该怎么做???
3条答案
按热度按时间rjzwgtxy1#
使用
base R
8qgya5xd2#
编号
输出
c8ib6hqw3#
在基数R中,可以使用
grepl
(搜索字符串中的模式,并返回布尔值TRUE/FALSE)和paste
,并指定collapse = "|"
(表示搜索这个"或"那个术语)来搜索术语,并为每个县返回布尔值(TRUE/FALSE),然后添加* 1
,将其转换为二分虚拟变量(0 = FALSE/1 = TRUE):输出: