我正在处理Netflix的数据集(https://www.kaggle.com/datasets/shivamb/netflix-shows),我试图找到在“演员”一栏中出现最多的前15名演员。
我的第一个问题是演员在每个单元格中用逗号分隔。我使用str.split函数创建了一个新的 Dataframe ,每个单元格中有一个演员,但是我找不到一种方法来计算每个演员出现的次数。
你能帮帮我吗?
谢谢
我尝试使用str.split获取新的 Dataframe
我正在处理Netflix的数据集(https://www.kaggle.com/datasets/shivamb/netflix-shows),我试图找到在“演员”一栏中出现最多的前15名演员。
我的第一个问题是演员在每个单元格中用逗号分隔。我使用str.split函数创建了一个新的 Dataframe ,每个单元格中有一个演员,但是我找不到一种方法来计算每个演员出现的次数。
你能帮帮我吗?
谢谢
我尝试使用str.split获取新的 Dataframe
1条答案
按热度按时间j8ag8udp1#
如果我能理解你从数据集中得到了什么,你现在有了一个列表,里面只有演员,按照一定的顺序和次数,你想把这个列表变成一个字典,键是演员,值是他们出现的次数。
实现这一点的一个简单方法是使用
collections
模块中的Counter
对象。