我有两个这样组织的 Dataframe 。
df1 <- data.frame(lastname = c("Miller", "Smith", "Grey"),
firstname = c("John", "Jane", "Hans")
)
df2 <- data.frame(lastname =c("Smith", "Grey"),
firstname = c("Jane", "Hans")
)
df2
不一定是df1
的子集。重复的条目也是可能的。
我的目标是保留一个df1
的副本,其中所有的条目都在两个dfs中出现。或者,我想用一个新变量结束df1
的子集,表明名称也是df2
的元素。有人能建议一种方法来做到这一点吗?一个{dyplr}
-尝试是完全可以的。
特定简单情况下的所需输出:
res <- data.frame(lastname = c("Smith", "Grey"),
firstname = c("Jane", "Hans")
)
1条答案
按热度按时间e0bqpujr1#
包括问题的“alternative”部分,这是一种
left_join
的方法。添加分组变量 grp 以区分2个集合。或以为底数R
merge
删除
NA
并压缩 grp另一部分则是