访问包含列表的Pandas DataFrame列的每个第一个元素

rvpgvaaj 于 2023-06-28 发布在其他

关注(0)|答案(5)|浏览(151)

我有一个Pandas DataFrame，其中有一列包含列表对象

A
0   [1,2]
1   [3,4]
2   [8,9] 
3   [2,6]

如何访问每个列表的第一个元素并将其保存到DataFrame的新列中？要得到这样的结果：

A     new_col
0   [1,2]      1
1   [3,4]      3
2   [8,9]      8
3   [2,6]      2

我知道这可以通过遍历每一行来完成，但是有没有什么“pythonic”的方法呢？

pandas

来源：https://stackoverflow.com/questions/37125174/accessing-every-1st-element-of-pandas-dataframe-column-containing-lists

5条答案

按热度按时间

f3temu5u1#

与往常一样，记住在帧中存储非标量对象通常是不受欢迎的，并且实际上应该仅用作临时的中间步骤。
也就是说，你可以使用.str访问器，即使它不是一列字符串：

>>> df = pd.DataFrame({"A": [[1,2],[3,4],[8,9],[2,6]]})
>>> df["new_col"] = df["A"].str[0]
>>> df
        A  new_col
0  [1, 2]        1
1  [3, 4]        3
2  [8, 9]        8
3  [2, 6]        2
>>> df["new_col"]
0    1
1    3
2    8
3    2
Name: new_col, dtype: int64

赞(0）回复(0）举报 2023-06-28

qpgpyjmq2#

您可以使用map和lambda函数

df.loc[:, 'new_col'] = df.A.map(lambda x: x[0])

赞(0）回复(0）举报 2023-06-28

30byixjq3#

将apply与x[0]一起使用：

df['new_col'] = df.A.apply(lambda x: x[0])
print df
        A  new_col
0  [1, 2]        1
1  [3, 4]        3
2  [8, 9]        8
3  [2, 6]        2

赞(0）回复(0）举报 2023-06-28

sxissh064#

可以使用str.get方法（与str[]相同）：

df['A'].str.get(0)

它的行为类似于Python字典的get方法，如果缺少所需的索引，则返回NaN。例如：

s = pd.Series([[1, 2], []])
s.str.get(0) # s.str[0]

输出：

0    1.0
1    NaN
dtype: float64

赞(0）回复(0）举报 2023-06-28

7bsow1i65#

你可以只使用一个条件列表解析，它接受任何可迭代对象的第一个值，或者对该项目使用None。列表解析是非常Python化的。

df['new_col'] = [val[0] if hasattr(val, '__iter__') else None for val in df["A"]]

>>> df
        A  new_col
0  [1, 2]        1
1  [3, 4]        3
2  [8, 9]        8
3  [2, 6]        2

- 时间**

df = pd.concat([df] * 10000)

%timeit df['new_col'] = [val[0] if hasattr(val, '__iter__') else None for val in df["A"]]
100 loops, best of 3: 13.2 ms per loop

%timeit df["new_col"] = df["A"].str[0]
100 loops, best of 3: 15.3 ms per loop

%timeit df['new_col'] = df.A.apply(lambda x: x[0])
100 loops, best of 3: 12.1 ms per loop

%timeit df.A.map(lambda x: x[0])
100 loops, best of 3: 11.1 ms per loop

取消安全检查以确保可接受性。

%timeit df['new_col'] = [val[0] for val in df["A"]]
100 loops, best of 3: 7.38 ms per loop

赞(0）回复(0）举报 2023-06-28

我来回答

访问包含列表的Pandas DataFrame列的每个第一个元素

5条答案

相关问题

热门标签

最新问答