- 此问题在此处已有答案**:
Filter based on number of distinct values per group [duplicate](2个答案)
昨天关门了。
我有这样一个数据集:
data <- tibble(year=c(2010,2010,2012,2010,2011,2011,2013,2013,2010,2011,2012,2013),
state=c("ca", "ca", "ca", "ny", "ny", "ny", "ny", "ny", "wa", "wa", "wa", "wa"),
variable2=c("a", "b", "c", "b", "c", "a", "d", "a", "b", "b", "c", "b"),
value=c(6,5,2,6,3,1,7,8,3,2,5,7))
我将只选择至少具有3个唯一年份的州的数据。在此数据中,这将是ny和wa。我希望保留这些州各自的所有数据。由于变量2,一些州在同一年有多个数据点,但我只对至少具有3个唯一年份的州感兴趣,而不管变量2的值如何。谢谢。
3条答案
按热度按时间idfiyjo81#
你可以试试
g6baxovj2#
试试这个,代码会删除少于三个唯一年份的行。
aiqt4smr3#
您可以定义一个长度唯一的函数
ulen
,并在ave
中使用它。