我想计算NA
值在 Dataframe 和变量中的百分比。
我的dataframe有这个:
mean(is.na(dataframe))
# 0.03354
我如何解读这个结果?Na 0.033%?我不明白。
对于单个变量,我对NA
s的计数执行了以下操作
sapply(DATAFRAME, function(x) sum(is.na(x)))
然后,对于NA
值的百分比:
colMeans(is.na(VARIABLEX))
不起作用,因为我得到了以下错误:
“x必须是至少二维的数组”
为什么会出现此错误?总之,后来我尝试了以下几点:
mean(is.na(VariableX))
# 0.1188
我应该将其解释为具有0.11% NA
-值吗?
2条答案
按热度按时间k10s72fa1#
我只需要将包含NA的行数除以总行数:
其给出:
也就是说我的数据框里有66.67%的NA
sq1bmfud2#
我不明白你想解决的问题。一切都如预期的那样工作。
首先是一个数据集,因为您还没有提供数据集。
现在是求和的代码。
这也适用于平均值,无论是
mean
还是colMeans
。编辑
下面是获取每列/变量
NA
值的平均值和总计的代码。