这是我的数据框。
structure(list(INVOICE_DATE = structure(c(19205, 19205, 19205,
19206, 19206, 19206, 19207, 19207, 19207), class = "Date"), CATEGORY = c("Accessory",
"Concentrate", "Edible", "Accessory", "Concentrate", "Edible",
"Accessory", "Concentrate", "Edible"), Crumble = c(NA, 47, NA,
NA, 65, NA, NA, 85, NA), Tincture = c(NA, NA, 567, NA, NA, 1028,
NA, NA, 830), Other = c(NA_real_, NA_real_, NA_real_, NA_real_,
NA_real_, NA_real_, NA_real_, NA_real_, NA_real_), Battery = c(1079,
NA, NA, 1027, NA, NA, 1148, NA, NA)), row.names = c(NA, -9L), class = c("tbl_df",
"tbl", "data.frame"))
我在R中找不到合适的动词或动词组来做这件事。
如何删除“NA”值,以便将数据框压缩到格式良好的表格中?CATEGORY
列可以删除,然后所有其他列都可以放在一行中,没有任何漏洞。
我不能做df %>% na.omit()
,因为我最终得到的是一个没有观测值的数据框,如果我尝试这种处理方法,情况也是如此:filter(is.na())
.
3条答案
按热度按时间guicsvcw1#
55ooxyrt2#
下面是使用分组
summarize()
的解决方案。0pizxfdo3#
使用
colSums
by
发票日期。