我有一个 Dataframe 与一堆信息(主要是字符)。我有2个ID列:一个链接到另一个 Dataframe ,并且具有唯一值,一个标识相同或几乎相同的行(分组ID)。我希望创建一个 Dataframe ,其中除了第一个ID列之外,组内的所有行都相同。基本上,我有df1,并且希望有df2。df1几乎没有缺失和一些不匹配的字符,我想清理它。2有没有一种方法可以识别一个组中不相同的行并替换它们(除了唯一的id)?
df <- data.frame(id = c(1:10),
title = c("abc", "aac", "abc", "def", "def", "dde", "ghi", NA, "jkl", "mno"),
id2 = c(1,1,1,2,2,2,3,4,4,5))
df2 <- data.frame(id = c(1:10),
title = c("abc", "abc", "abc", "def", "def", "def", "ghi", "jkl", "jkl", "mno"),
id2 = c(1,1,1,2,2,2,3,4,4,5))
1条答案
按热度按时间4xrmg8kj1#
您只需将每个组中的
title
列替换为它的第一个非NA成员: