我想删除在任意列数的子集中重复的所有值(在下面的示例中我使用了2),而不删除整行。
Dataframe :
A B C
0 foo g A
1 foo g G
2 yes y B
3 bar y B
预期结果:
A B C
0 foo g A
1 NaN NaN G
2 yes y B
3 bar Nan NaN
我尝试过drop_duplicates()
特性,按列将数据分组到新的 Dataframe 中,然后将它们重新追加到一起,但这有其自身的问题。
我也有tried this solution和this one,但仍然卡住了。任何指导都将非常感谢。
2条答案
按热度按时间fruv7luv1#
在不删除整行的情况下,可以使用NaN过滤重复值。
我指的是this。
m1m5dgzv2#
试试这个: