我正尝试根据 Dataframe 列的平均值来过滤 Dataframe 列表。例如:
# creating df1
df1 <- as_tibble(mtcars)
# creating df2
df2 <- as_tibble(iris)
# creating list of df (df_list)
df_list <- list(mtcars,iris)
# Checking the structure of the list
str(df_list)
List of 2
$ : tibble [32 × 11] (S3: tbl_df/tbl/data.frame)
..$ mpg : num [1:32] 21 21 22.8 21.4 18.7 18.1 14.3 24.4 22.8 19.2 ...
..$ cyl : num [1:32] 6 6 4 6 8 6 8 4 4 6 ...
..$ disp: num [1:32] 160 160 108 258 360 ...
..$ hp : num [1:32] 110 110 93 110 175 105 245 62 95 123 ...
..$ drat: num [1:32] 3.9 3.9 3.85 3.08 3.15 2.76 3.21 3.69 3.92 3.92 ...
..$ wt : num [1:32] 2.62 2.88 2.32 3.21 3.44 ...
..$ qsec: num [1:32] 16.5 17 18.6 19.4 17 ...
..$ vs : num [1:32] 0 0 1 1 0 1 0 1 1 1 ...
..$ am : num [1:32] 1 1 1 0 0 0 0 0 0 0 ...
..$ gear: num [1:32] 4 4 4 3 3 3 3 4 4 4 ...
..$ carb: num [1:32] 4 4 1 1 2 1 4 2 2 4 ...
$ : tibble [150 × 5] (S3: tbl_df/tbl/data.frame)
..$ Sepal.Length: num [1:150] 5.1 4.9 4.7 4.6 5 5.4 4.6 5 4.4 4.9 ...
..$ Sepal.Width : num [1:150] 3.5 3 3.2 3.1 3.6 3.9 3.4 3.4 2.9 3.1 ...
..$ Petal.Length: num [1:150] 1.4 1.4 1.3 1.5 1.4 1.7 1.4 1.5 1.4 1.5 ...
..$ Petal.Width : num [1:150] 0.2 0.2 0.2 0.2 0.2 0.4 0.3 0.2 0.2 0.1 ...
..$ Species : Factor w/ 3 levels "setosa","versicolor",..: 1 1 1 1 1 1 1 1 1 1 ...
我想获得每个df(本例中为disp
和Petal.Lenght
)的第3列的平均值,然后只保留这些列的平均值〉10的df。
我尝试过以下方法:
1.我创建了一个函数,它根据计算的平均值返回一个逻辑值:
mean_logical <- function(column_mean) {
column_mean_logical <- if_else(mean(column_mean) > 10, TRUE, FALSE)
return(column_mean_logical)
}
1.然后,我想使用keep from {purrr}
并应用我的函数(mean_logical
)来过滤第三列中平均值〈10的df。然而,我正在努力如何指示检查列表中每个df的第三列。
值得注意的是,我发现“访问”列表中每个df的第三列的唯一方法是使用以下代码:
lapply(df_list, "[", 3)
有什么建议吗?先谢了!
4条答案
按热度按时间628mspwn1#
您可以从
base
使用Filter
或将
keep
从purrr
转换为:一个匿名 predicate 函数。
jmo0nnb32#
使用
subset
或使用[
进行索引的方法自R 4.1.0起,您可以将
function(x)
缩短为\(x)
tag5nh1u3#
discard
的另一个选项57hvy0tb4#
使用
map
: