如果这是一个可能的重复,我很抱歉。我有一个看起来像这样的数据框:
label api_spec_id content
375.0
375.0
375.0 Request Parameter Removed, Field type missing, Violation
375.0 Path Removed w/o Deprecation
385.0
minor 385.0 Request Type Change,Removed param, Interface missing
patch 395.0 Path Removed w/o Deprecation
patch 395.0 Path Removed w/o Deprecation
minor 400.0 New Required Request Property
minor 400.0 Response Success State Removed, Violation
major 400.0 Field type changed
我想计算api_spec_id
的unique
数量,其中在content
中,对于每个标签类别,它们有多个字段(它们总是用逗号分隔)。
因此,预期输出为:patch
:0minor
:2major
:0Nan
:1
任何建议将不胜感激。
1条答案
按热度按时间utugiqy61#
你可以在从
str.contains
得到的布尔序列上使用groupby.nunique
来识别包含逗号的字符串:或者
输出: