在R中编写SAS宏的等效项

aor9mmx1 于 2023-06-27 发布在其他

关注(0)|答案(1)|浏览(104)

抱歉重复，但我意识到我写得很糟糕，所以这是我的第二次尝试：
我在SAS中有以下宏，我正试图将其迁移到R：

%macro recode_var(var=);
if &var in (1,2,3,4,5) then do;
    if &var = 1 then &var._r = 0;
    if &var = 2 then &var._r = 25;
    if &var = 3 then &var._r = 50;
    if &var = 4 then &var._r = 75;
    if &var = 5 then &var._r = 100;
end;
%mend;

这是由行调用的

%recode_var(var=Q7_1);

这创建了具有基于Q7_1的值的值的新变量Q7_1_r。我有100个变量来调用宏（例如Q7_5、Q15_6、Q35_4）。写R等价物的最好方法是什么？
下面是我尝试的一个可重复的示例：

Q1_1 <- c(1,2,3,4,5)
    Q1_2 <- c(5,4,5,3,2)
    Q1_3 <- c(3,4,5,1,1)

    df <- data.frame(Q1_1,Q1_2,Q1_3)

    df

    testvar <- function(var){
    newfile <- mutate(df, var||_r = case_when(var == 1 ~ 0,
                                                var == 2 ~ 25,
                                                var == 3 ~ 50,
                                                var == 4 ~ 75,
                                                var == 5 ~ 100))
    }

    testing <- testvar(df$Q1_2)
    testing <- testvar(df$Q1_3)
    testing

这将创建一个名为“var_r”的新变量，该变量的值基于输入变量的值。（例如，对于Q1_2，它给出var_r为100，75，100，50，25，而Q1_3产生50，75，100，0，0）。此新变量是数据框的一个额外列。有两件事我正在尝试做这件事，并寻求建议：
1.我希望输出变量的名字是基于输入变量的名字--取输入变量的名字，并在上面加上“_r”。代替“var_r”，如果输入变量var是Q6_1，则新变量将是Q6_1_r。我希望这适用于输入变量“var”的任何输入值，然后运行下面的代码行（testing <- testvar（df$Q1_2））来分配一个值“var”，然后它将成为新变量名称的一部分。
1.我有超过100个变量用于这个块，所以一旦我做了一次，例如。对于Q1_2，我想再次运行它，并向集合中添加另一个变量，例如。Q2_2。
因此，在上面的结尾处的输出将具有六列-
Q1_1、Q1_2、Q1_3、Q1_1_r、Q1_2_r、Q1_3_r
并根据代码输入适当的条目。如果我可以对可重现的示例这样做，那么我可以将其应用于我拥有的100个变量。我希望这是现在更清楚。有什么建议吗

r

来源：https://stackoverflow.com/questions/76541123/write-equivalent-of-sas-macro-in-r

1条答案

按热度按时间

sd2nnvve1#

一个简单的方法是这样的：

# amended dataset to cover additional needs:
Q1_1 <- c(1,2,3,4,5)
Q1_2 <- c(5,4,5,3,2)
Q1_3 <- c(7,6,5,1,1)
df <- data.frame(Q1_1,Q1_2,Q1_3)

library(tidyverse)

typeA <- c("Q1_1", "Q1_2")
typeB <- c("Q1_3")

df %>%
  mutate(across(all_of(typeA), # Apply the function to each column whose name matches a string in object typeA
                ~ case_when(
                  . == 1 ~ 0,
                  . == 2 ~ 25,
                  . == 3 ~ 50,
                  . == 4 ~ 75,
                  . == 5 ~ 100),
                .names = "{.col}_r")) %>% # name of new column is the old name plus "_r" 
  mutate(across(all_of(typeB), # again but for typeB
                ~ case_when(
                  . == 1 ~ 0,
                  . == 2 ~ 12.5,
                  . == 3 ~ 25,
                  . == 4 ~ 37.5,
                  . == 5 ~ 50,
                  . == 6 ~ 62.5,
                  . == 7 ~ 75,
                  . == 8 ~ 87.5,
                  . == 9 ~ 100),
                .names = "{.col}_r"))

输出：

Q1_1 Q1_2 Q1_3 Q1_1_r Q1_2_r Q1_3_r
1    1    5    7      0    100   75.0
2    2    4    6     25     75   62.5
3    3    5    5     50    100   50.0
4    4    3    1     75     50    0.0
5    5    2    1    100     25    0.0

如果你真的想让它成为一个接受变量的函数，你可以，但是如果你能制定一个定义列的select语句（例如我的starts_with("Q")，或合适标题的向量），那么这是一个简单的方法。
注意-这可能会使事情过于复杂。如果这个比例和你的例子一样，而不仅仅是一个简化的版本，那么你可以这样做：

df %>%
  mutate(across(all_of(typeA),
                ~ (.-1)*25,
                .names = "{.col}_r")) %>% 
  mutate(across(all_of(typeB), 
                ~ (.-1)*12.5,
                .names = "{.col}_r"))

编辑：更新为允许不同的答案类型块

赞(0）回复(0）举报 2023-06-27

我来回答

在R中编写SAS宏的等效项

1条答案

相关问题

热门标签

最新问答