比如我有一个数据框
count
A 20
B 20
C 15
D 10
E 10
F 8
G 7
H 5
I 5
如果我想把它分成几组(最大75%、15%和最后10%),
count Class
A 20 Top1
B 20 Top1
C 15 Top1
D 10 Top1
E 10 Top1
F 8 Top2
G 7 Top2
H 5 Top3
I 5 Top3
我如何实现这一点?我知道有一个pd.cut,但在pd.cut[target]
中,它会削减有关计数的信息(只产生A,B,C等)。
谢谢
1条答案
按热度按时间pgvzfuti1#
理论上,可以使用
qcut
:输出(注意略有不同的示例):
但是
qcut
对空的箱子非常敏感,这在当前的情况下是行不通的。输出量: