我正在寻找提取连续的行,指定的文本连续重复超过5次。
例如:
A B C
10 john 1
12 paul 1
23 kishan 1
12 teja 1
12 zebo 1
324 vauh -1
3434 krish -1
232 poo -1
4535 zoo 1
4343 doo 1
342 foo -1
123 soo 1
121 koo -1
34 loo -1
343454 moo -1
565343 noo -1
2323234 voo -1
3434 coo 1
545 xoo 1
6565 zoo 1
232321 qoo 1
34454 woo 1
546556 eoo 1
65665 roo -1
5343 too -1
3232 yoo 1
1212 uoo 1
23355667 ioo 1
787878 joo -1
我正在寻找下面的结果,其中列值'c'有连续的1重复超过4次作为不同的组。
输出量:
A B C group
10 john 1 1
12 paul 1 1
23 kishan 1 1
12 teja 1 1
12 zebo 1 1
3434 coo 1 2
545 xoo 1 2
6565 zoo 1 2
232321 qoo 1 2
34454 woo 1 2
546556 eoo 1 2
2条答案
按热度按时间tktrz96b1#
使用掩码和
factorize
:输出量:
d6kp6zgx2#
你可以
groupby
列C的差,得到cumsum
,其中差不等于零,并转换每个组的大小,这样你就只能保留大于或等于5的组如果您想要一个组列,