我有下面的Pandas DataFrame
Key Value
A 10
A 20
B 30
B 40
C 50
A 60
A 70
A 70
B 80
A 90
字符串
我需要创建一个索引,只有当键重复后,不同的键序列后,自动递增。所以,我需要这样的输出:
Key Value Index
A 10 1
A 20 1
B 30 1
B 40 1
C 50 1
A 60 2
A 70 2
A 70 2
B 80 2
A 90 3
型
谢谢你,谢谢
我尝试使用方法groupby
和cumcount() + 1
,但它不工作。
4条答案
按热度按时间zpqajqem1#
字符串
对正在发生的事情的快速分解
型
ttp71kqs2#
使用有序的Categorical和
numpy.cumsum
:字符串
categories=['X', 'Z', 'Y']
。*或者,像@SimonT评论的那样,如果你的类别是按字典排序的:
型
输出量:
型
fgw7neuy3#
另一种方法是使用
pd.factorize
计算密集秩字符串
输出:
型
a1o7rhls4#
试试这个:
字符串
或者是
型
输出量:
型