我有一个Pandas数据框,如下所示
| 识别码|日期|援助|
| - -|- -|- -|
| 第0页|2022年1月1日|一个|
| 一个|2022年1月1日|两个|
| 2个|2022年1月5日|一个|
| 三个|2022年1月6日|三个|
| 四个|2022年1月2日|一个|
| 五个|2022年1月1日|一个|
我想添加一个列“计数器”,对于每一行,它将包含具有相同“Aid”和“Date”的行数,这些行的“Date”小于或等于该行的“Date”
因此,对于行4,“计数器”= 3(行0、4、5)。
结果应该是:
| 识别码|日期|援助|计数器|
| - -|- -|- -|- -|
| 第0页|2022年1月1日|一个|2个|
| 一个|2022年1月1日|两个|一个|
| 2个|2022年1月5日|一个|四个|
| 三个|2022年1月6日|三个|一个|
| 四个|2022年1月2日|一个|三个|
| 五个|2022年1月1日|一个|2个|
有没有办法在Pandas身上做这个计数呢?
原始 Dataframe 包含数百万行,因此效率非常重要
1条答案
按热度按时间yyyllmsg1#
rank
,使用最大值方法输出:
输出到计数器列
实验结果: