这个问题已经有答案了:
Remove duplicate rows by considering two columns and ignore the order [duplicate](1个回答)
10天前关闭。
在
df <- data.frame(A = c(LETTERS[1:6], "A"),
B = c(rev(LETTERS[1:6]), "F"))
字符串
如何计算不唯一的行的数量?该函数需要识别逆序对。
在上面的例子中,没有任何唯一的字母组合(3 x A/F; 2 x B/E,2 x C/D),所以答案是“0”。
(字母可以替换为任何字符串或因子水平)
3条答案
按热度按时间vlurs2pr1#
可以先对行进行排序(使用
sort
),然后再计数(使用table
)。我使用paste0(x, collapse = "")
将有序的值对组成一个唯一的字符串。字符串
roejwanj2#
按行排序,然后检查是否重复:
字符串
disho6za3#
第一条评论:“AF”在您的设置中确实出现了两次.
如果你想知道有多少非唯一行出现,你可以计算行数,唯一行和子行的数量(这里给出“1”作为结果)
字符串