从Pandas列(字典列表)中提取值

qmb5sa22 于 2023-01-24 发布在其他

关注(0)|答案(2)|浏览(261)

一个名为top_chart_movies的panda Dataframe ，它有一个列genres，该列有一个字典列表，如下图

所示
列值在列表中具有不同数量的字典项。
如何将值提取为列表并将其包含到另一列genres1中，其中
top_chart_movies [类型1]. head（2）

1881  ["Drama","Crime"]
3337 ["Drama","Crime"]

我尝试了下面的代码，但它不工作.

top_chart_movies['genres1'] = [value for key, value in top_chart_movies['genres']]

编辑：当我键入以下代码时

top_chart_movies['genres'].iloc[1]

我得到：

'[{"id": 18, "name": "Drama"}, {"id": 80, "name": "Crime"}]'

因此，这些值存储为字符串。

pandas

来源：https://stackoverflow.com/questions/75205435/extraction-of-values-from-pandas-column-which-is-a-list-of-dictionaries

2条答案

按热度按时间

mkshixfv1#

这应该行得通：

top_chart_movies['genres1'] = [[genres_item['name'] for genres_item in genres_list] for genres_list in top_chart_movies["genres"]]

工作原理：如果我们迭代top_chart_movies["genres"]，如下所示：for genres_list in top_chart_movies["genres"]，则对于每一行，genres_list将包含一个字典列表，字典的关键字为"id"和"name"。例如，在第一行中，genres_list将为[{"id": 18, "name": "Drama"}, {"id": 80, "name": "Crime"}]。
对于每一行，我们在genres_list上迭代，例如for genres_item in genres_list，在genres_item中的每一次迭代都得到一个字典，例如{"id": 18, "name": "Drama"}，然后我们只取"name"部分：genres_item["name"].
因此，对于每一行，为了获得流派的"name"元素的列表，我们执行[genres_item['name'] for genres_item in genres_list]，并在每一行中执行如下操作：[[genres_item['name'] for genres_item in genres_list] for genres_list in top_chart_movies["genres"]]

- 编辑：**

正如提问者所指出的，原来genres列表是字符串表示的，但是没有指定是python的字符串表示还是json的字符串表示还是其他的，所以我们只能用json.loads或者ast.literal_eval解析。
如果它在json string中，应该可以：

import json
top_chart_movies['genres1'] = [[genres_item['name'] for genres_item in json.loads(genres_list)] for genres_list in top_chart_movies["genres"]]

如果它是python字符串表示形式，这应该可以工作：

from ast import literal_eval
top_chart_movies['genres1'] = [[genres_item['name'] for genres_item in literal_eval(genres_list)] for genres_list in top_chart_movies["genres"]]

赞(0）回复(0）举报 2023-01-24

h7appiyu2#

def get_genre(lst):
    return [item["name"] for item in lst]

top_chart_movies['genres1'] = top_chart_movies['genres'].map(get_genre)

您不需要与每个键关联的所有值，而只需要与每个键["name"]对应的值。
一旦知道如何从一个列表中提取它们，就可以将该函数map到列表列中。

赞(0）回复(0）举报 2023-01-24

我来回答

从Pandas列(字典列表)中提取值

2条答案

相关问题

热门标签

最新问答