- 此问题在此处已有答案**:
Filter R dataframe to n most frequent cases and order by frequency(2个答案)
(9个答案)
昨天关门了。
我有这样的表,并希望计数出现最多的基因(让我们说前10个基因),然后找出这些前10个基因的tail_len的平均值。
| | 基因|尾部_镜头|
| - ------|- ------|- ------|
| 1个|SPAC20G4.06c|三个|
| 第二章|SPCC613.06|五个|
| 三个|SPAC6F6.03c|第二章|
| 四个|SPAC20G4.06c|三个|
| 五个|SPBC23G7.15c|五个|
| 六个|SPAC589.10c|第二章|
| 七|SPBC23G7.15c|三个|
| 八个|SPAC22H12.04c|1个|
| 九|SPAC22H12.04c|十二|
| 十个|SPAC6G10.11c|八个|
| 十一|SPAC589.10c|三十一|
| 十二|SPBC18E5.06|十六|
2条答案
按热度按时间3htmauhk1#
没有更大的数据集很坚韧进行测试,但这是一种使用
dplyr
的方法:2ul0zpep2#
这里是
slice_max
的一种方法。我定义了两个变量,ties_ok
和max_n
。后者被设置为3来测试代码,你需要max_n <- 110
,如果你想放弃平局,只保留找到的前几行,前者可以被设置为FALSE
。创建于2023年1月20日,使用reprex v2.0.2