我有一个类似下面的dataframe(可用数组格式或unnest格式):
team | player | favorite_food
A | A_player1 | [pizza, sushi]
A | A_player2 | [salad, sushi]
B | B_player1 | [pizza, pasta, salad, taco]
B | B_player2 | [taco, salad, sushi]
B | B_player3 | [taco]
我想得到每支球队球员共有的食物数量和百分比。如下所示:
team | #_food_common | percent_food_common
A | 1 | 0.33
B | 1 | 0.2
在Python中做这件事的好方法是什么,最好是Pandas?
1条答案
按热度按时间wtzytmuj1#
您可以使用
set
操作和groupby.agg
:输出:
使用的输入: