我有一个Pandas的数据框看起来像
col_1 col_2
6 A
2 A
5 B
3 C
5 C
3 B
6 A
6 A
2 B
2 C
5 A
5 B
我想添加一个新列col_new
,它计算col_1
和col_2
中元素相同的行数,但不包括该行本身。
col_1 col_2 col_new
6 A 2
2 A 0
5 B 1
3 C 0
5 C 0
3 B 0
6 A 2
6 A 2
2 B 0
2 C 0
5 A 0
5 B 1
这里是什么,我尝试了,但我不确定这是否是正确的方法:df['col_new'] = df.groupby(['col_1', 'col_2']).count()
但是我得到了错误:TypeError: incompatible index of inserted column with frame index
先谢了。
2条答案
按热度按时间h9a6wy2h1#
您可以用途:
输出:
yhived7q2#
我会使用
value_counts
方法。col3
的第三列,并存储行值的元组。元组与列表不同,它是可散列的,可用于创建计数键。Series
。这将用作查找表。一个二个一个一个
counts
的第四列