我有这个调查数据集,我想指出用户的偏好。数据集看起来像这样:
User Men Women Non-bi Asexual
1 Men Women
2 Men
3 Women Non-bi
4 Asexual
我希望能够统计出有多少用户喜欢男性、女性、非双性恋或两者的组合。在python中有没有简单的方法来统计这些数据并给予统计数据?
一个想法是将所有答案转换为一个列表或一列,然后我可以计算不同组合的示例。
2条答案
按热度按时间8cdiaqws1#
您可以用途:
输出:
3
b91juud32#
如果需要计算所有答案的组合,将行转换为
frozenset
s,删除缺失值并使用Series.value_counts
:或者通过
DataFrame.stack
进行整形,并转换为frozenset
s:或者,如果需要通过列表匹配值-每行只计数一次,使用
DataFrame.isin
,通过Series.any
至少生成一个True
,并通过sum
计数布尔值: