我有两个数据集,其中在列edta_complete
中0是不完整的,1是完整的。我尝试比较df和df1中的这些列。1)我需要比较两个数据集中完整edta的subject_ids的计数。2)如果一个数据集比另一个数据集具有更多完整条目,则显示不同的subject_ids。请参见下面的示例:
DF:
df <- structure (list(subject_id = c("191-5467", "191-6784", "191-3457", "191-0987", "191-1245", "191-2365"), edta_complete = c("1","0","1","1","1","0")), class = "data.frame", row.names = c (NA, -6L))
DF1:
df1 <- structure (list(subject_id = c("191-5467", "191-6784", "191-3457", "191-0987", "191-1245", "191-2365"), edta_complete = c("1","1","1","1","1","1")), class = "data.frame", row.names = c (NA, -6L))
edta_complete的计数= 1
一个二个一个一个
我需要一个代码,这将显示我在df1 191-6784
和191-2365
不同于df。希望这是有意义的。
2条答案
按热度按时间oyt4ldly1#
我们可以使用
setdiff
来查找在df1中找到而在df中没有找到的subject_id或者使用
anti_join
jv4diomz2#
同样使用
bind_cols()
: