如果前缀相似,我会查看groupby几列,并根据一列内的分类值计算总和。
数据
name type size
AA:3400 5
AA:3401 FALSE 1
AA:3402 FALSE 2
AA:3404 FALSE 0
AA:3409 FALSE 1
AA:3410 FALSE 8
AA:3412 FALSE 9
BB:3400 TRUE 4
BB:3401 FALSE 7
期望
name type size
AA TRUE 0
AA FALSE 21
AA 5
BB TRUE 4
BB FALSE 7
BB
做
df.groupby(['name', 'type'], dropna=False, as_index=False)['size'].sum()
但是,如果值具有相同的前缀,我该如何分组?任何建议都很感激。
2条答案
按热度按时间nimxete21#
您可以尝试:
输出:
gywdnpxw2#
就像@Timeless解决方案一样,我会这样做:
输出: