如何在R中删除空列？

k7fdbhmy 于 2023-05-20 发布在其他

关注(0)|答案(8)|浏览(149)

我有一个CSV文件

Identity,Number,Data,Result,Add,,,,,,,,,,,,
1,,,,4,55,,92,,,,,,,,,62,
3,,,,7,43,,12,,,,,,,,,74,
7,,,,3,58,,52,,,,,,,,,64,
0,,,,6,10,,22,,,,,,,,,96,
3,,,,8,13,,92,,,,,,,,,22,

如何在R中删除空列？
期望输出

Identity,Number,Data,Result,Add
1,4,55,92,62
3,7,43,12,74
7,3,58,52,64
0,6,10,22,96
3,8,13,92,22

来源：https://stackoverflow.com/questions/22104962/how-to-remove-empty-columns-in-r

8条答案

按热度按时间

5m1hhzi41#

导入数据后（使用其他回答者建议的方法），运行以下命令，将mydf替换为您决定调用的 Dataframe ：

#Remove empty columns
mydf <- Filter(function(x)!all(is.na(x)), mydf)

赞(0）回复(0）举报 2023-05-20

kcrjzv8t2#

将空单元格转换为NA，然后删除NA

mydata[mydata == ""] <- NA
mydata<- mydata[,colSums(is.na(mydata)) < <a desired filter value>]

赞(0）回复(0）举报 2023-05-20

vktxenjb3#

更复杂的移除逻辑是这样的：

mydf <- Filter(function(x)!all(is.na(x) || is.null(x) || x == "" || x == 0), mydf)

赞(0）回复(0）举报 2023-05-20

vi4fp9gy4#

从janitor尝试remove_empty
使用来自托马斯的帖子的输入：

> mydf

  V1 V2 V3 V4 V5 V6 V7 V8 V9 V10 V11 V12 V13 V14 V15 V16 V17 V18
1  1 NA NA NA  4 55 NA 92 NA  NA  NA  NA  NA  NA  NA  NA  62  NA
2  3 NA NA NA  7 43 NA 12 NA  NA  NA  NA  NA  NA  NA  NA  74  NA
3  7 NA NA NA  3 58 NA 52 NA  NA  NA  NA  NA  NA  NA  NA  64  NA
4  0 NA NA NA  6 10 NA 22 NA  NA  NA  NA  NA  NA  NA  NA  96  NA
5  3 NA NA NA  8 13 NA 92 NA  NA  NA  NA  NA  NA  NA  NA  22  NA

> mydf %>% remove_empty("cols")

1  1  4 55 92  62
2  3  7 43 12  74
3  7  3 58 52  64
4  0  6 10 22  96
5  3  8 13 92  22

赞(0）回复(0）举报 2023-05-20

waxmsbnn5#

如果我们的列数有限，就像您在本例中的列数一样，下面是一个很好的解决方法。

myDF<-myDF[,c(1,2,3,4,5)]

赞(0）回复(0）举报 2023-05-20

dojqjjoe6#

加载数据文件，不包括标题行：

mydf <- 
read.csv(text='Identity,Number,Data,Result,Add
1,,,,4,55,,92,,,,,,,,,62,
3,,,,7,43,,12,,,,,,,,,74,
7,,,,3,58,,52,,,,,,,,,64,
0,,,,6,10,,22,,,,,,,,,96,
3,,,,8,13,,92,,,,,,,,,22,', header=FALSE, skip=1)

然后只加载标题行：

n <- read.csv(text='Identity,Number,Data,Result,Add', header=TRUE)

然后使用来自n的名称为完整数据分配名称，不包括NA列：

setNames(mydf[,sapply(mydf, function(x) all(!is.na(x)))],names(n))

请注意，如果您将其保存为文件，则完整代码应为：

mydf <- read.csv('file.csv', header=FALSE, skip=1)
n <- read.csv('file.csv', header=TRUE, nrows=1)
setNames(mydf[,sapply(mydf, function(x) all(!is.na(x)))],names(n))

赞(0）回复(0）举报 2023-05-20

aurhwmvo7#

你只保留那些名字不为空的列怎么样？

> mydf <- mydf[,names(mydf)!=""]

赞(0）回复(0）举报 2023-05-20

y3bcpkx18#

这是一个我有时候为了好玩而使用的奇特函数。请注意，它并不健壮-它会在整个环境中搜索.data数据集，如果运行select()，则dplyr会将其放在那里，因此它取决于其内部框架（可能会更改）：

empty_cols <- function(x) {
  for (frm in sys.frames()) {
    if (is.data.frame(frm$.data)) {
      df <- frm$.data
      return(which(sapply(df, function(col) all(is.na(col)))))
    }
  }
  # found nothing, return NULL to return no columns:
  NULL
}

现在选择使用：

library(dplyr)
my_df %>% select(!empty_cols())

如果我们可以在这个函数中使用dplyr::pick(everything())就好了，但是他们限制了mutate()，filter()和group_by()的使用。

赞(0）回复(0）举报 2023-05-20

我来回答

如何在R中删除空列？

8条答案

相关问题

热门标签

最新问答