在R中使用pmax/pmin与变量字符串名称的向量

hmae6n7t  于 2023-04-09  发布在  其他
关注(0)|答案(2)|浏览(149)

有没有一种方法可以在R中使用pmax和pmin函数,并使用tidyverse(dplyr)格式的字符串变量名向量?
例如,我想运行以下命令:

data(mtcars)
mtcars %>% mutate(maxval = pmax(drat, wt, na.rm = T)

这会让我得到以下结果:

mpg cyl  disp  hp drat    wt  qsec vs am gear carb maxval
Mazda RX4           21.0   6 160.0 110 3.90 2.620 16.46  0  1    4    4  3.900
Mazda RX4 Wag       21.0   6 160.0 110 3.90 2.875 17.02  0  1    4    4  3.900
Datsun 710          22.8   4 108.0  93 3.85 2.320 18.61  1  1    4    1  3.850
Hornet 4 Drive      21.4   6 258.0 110 3.08 3.215 19.44  1  0    3    1  3.215
Hornet Sportabout   18.7   8 360.0 175 3.15 3.440 17.02  0  0    3    2  3.440
Valiant             18.1   6 225.0 105 2.76 3.460 20.22  1  0    3    1  3.460
Duster 360          14.3   8 360.0 245 3.21 3.570 15.84  0  0    3    4  3.570
Merc 240D           24.4   4 146.7  62 3.69 3.190 20.00  1  0    4    2  3.690
Merc 230            22.8   4 140.8  95 3.92 3.150 22.90  1  0    4    2  3.920
Merc 280            19.2   6 167.6 123 3.92 3.440 18.30  1  0    4    4  3.920
Merc 280C           17.8   6 167.6 123 3.92 3.440 18.90  1  0    4    4  3.920
Merc 450SE          16.4   8 275.8 180 3.07 4.070 17.40  0  0    3    3  4.070
Merc 450SL          17.3   8 275.8 180 3.07 3.730 17.60  0  0    3    3  3.730
Merc 450SLC         15.2   8 275.8 180 3.07 3.780 18.00  0  0    3    3  3.780
Cadillac Fleetwood  10.4   8 472.0 205 2.93 5.250 17.98  0  0    3    4  5.250
Lincoln Continental 10.4   8 460.0 215 3.00 5.424 17.82  0  0    3    4  5.424
Chrysler Imperial   14.7   8 440.0 230 3.23 5.345 17.42  0  0    3    4  5.345
Fiat 128            32.4   4  78.7  66 4.08 2.200 19.47  1  1    4    1  4.080

但是,假设我正在处理一个非常大的数据,有很多变量,我想只使用一个字符串向量,如x1 = sprintf("xval_%1.0f", 1:25),其中x1将是我想运行pmax和pmin的变量列列表。但是当我这样做时,我总是得到一个错误消息,混淆了向量的数量和观察的数量。例如,假设我运行以下内容:

values = c("drat", "wt")
mtcars %>% mutate(maxval = pmax(all_of(values), na.rm = T))

然后我得到以下错误:

Error: Problem with `mutate()` column `maxval`.
i `maxval = pmax(values, na.rm = T)`.
i `maxval` must be size 32 or 1, not 2.

这似乎是在观察的数量(32)。

7eumitmz

7eumitmz1#

我们可以将invoke(类似于base R中的do.call)与across一起使用

library(purrr)
library(dplyr)
out <- mtcars %>% 
        mutate(maxval = invoke(pmax, c(across(all_of(values)), na.rm = TRUE)))
        # or use do.call
        #  mutate(maxval = do.call(pmax, c(across(all_of(values)), na.rm = TRUE)))
  • 输出
> head(out)
                   mpg cyl disp  hp drat    wt  qsec vs am gear carb maxval
Mazda RX4         21.0   6  160 110 3.90 2.620 16.46  0  1    4    4  3.900
Mazda RX4 Wag     21.0   6  160 110 3.90 2.875 17.02  0  1    4    4  3.900
Datsun 710        22.8   4  108  93 3.85 2.320 18.61  1  1    4    1  3.850
Hornet 4 Drive    21.4   6  258 110 3.08 3.215 19.44  1  0    3    1  3.215
Hornet Sportabout 18.7   8  360 175 3.15 3.440 17.02  0  0    3    2  3.440
Valiant           18.1   6  225 105 2.76 3.460 20.22  1  0    3    1  3.460

或者也可以使用exec

out2 <- mtcars %>%
      mutate(maxval = exec(pmax, !!! rlang::syms(values), na.rm = TRUE))
  • 输出
> head(out2)
                   mpg cyl disp  hp drat    wt  qsec vs am gear carb maxval
Mazda RX4         21.0   6  160 110 3.90 2.620 16.46  0  1    4    4  3.900
Mazda RX4 Wag     21.0   6  160 110 3.90 2.875 17.02  0  1    4    4  3.900
Datsun 710        22.8   4  108  93 3.85 2.320 18.61  1  1    4    1  3.850
Hornet 4 Drive    21.4   6  258 110 3.08 3.215 19.44  1  0    3    1  3.215
Hornet Sportabout 18.7   8  360 175 3.15 3.440 17.02  0  0    3    2  3.440
Valiant           18.1   6  225 105 2.76 3.460 20.22  1  0    3    1  3.460
ykejflvf

ykejflvf2#

dplyr现在包含c_across函数,该函数与rowwise()一起使用,以支持使用select helper,如starts_withends_withall_ofwhere(is.numeric)

library(dplyr)
values = c("drat", "wt")
out <- mtcars %>% 
    rowwise() %>%
    mutate(maxval = max(c_across(all_of(values)), na.rm=TRUE))

相关问题