python-3.x 按索引迭代 Dataframe

93ze6v8z 于 2023-02-26 发布在 Python

关注(0)|答案(3)|浏览(188)

我有一个名为staticData的 Dataframe ，如下所示：

narrow_sector       broad_sector country exchange  \
unique_id                                                                    
BBG.MTAA.STM.S          Semiconductors         Technology      CH     MTAA   
BBG.MTAA.CNHI.S  Machinery-Diversified         Industrial      GB     MTAA   
BBG.MTAA.FCA.S      Auto Manufacturers  Consumer Cyclical      GB     MTAA   
BBG.MTAA.A2A.S                Electric          Utilities      IT     MTAA   
BBG.MTAA.ACE.S                Electric          Utilities      IT     MTAA

我试图通过 Dataframe 逐行迭代挑选两位信息索引（unique_id）和交换。我有一个问题迭代索引。请看我的代码：

for i, row in staticData.iterrows():
        
    unique_id = staticData.ix[i]

    exchange = row['exchange']

我试过unique_id = row['unique_id']，但无法使用...
我正在尝试返回row1的say

unique_id = BBG.MTAA.STM.S
exchange = MTAA

python-3.x

来源：https://stackoverflow.com/questions/36864690/iterate-through-a-dataframe-by-index

3条答案

按热度按时间

irlmq6kh1#

您需要以下内容：

for i, row in staticData.iterrows():
    unique_id = i
    exchange = row['exchange']

i将是索引标签值
示例：

In [57]:
df = pd.DataFrame(np.random.randn(5,3), index=list('abcde'), columns=list('fgh'))
df

Out[57]:
          f         g         h
a -0.900835 -0.913989 -0.624536
b -0.854091  0.286364 -0.869539
c  1.090133 -0.771667  1.258372
d -0.721753 -0.329211  0.479295
e  0.520786  0.273722  0.824172

In [62]:
for i, row in df.iterrows():
    print('index: ', i, 'col g:', row['g'])

index:  a col g: -0.913988608754
index:  b col g: 0.286363847188
index:  c col g: -0.771666520074
index:  d col g: -0.329211394286
index:  e col g: 0.273721527592

赞(0）回复(0）举报 2023-02-26

wfsdck302#

可能更像潘达斯的方式？

staticData.apply((lambda x: (x.name, x['exchange'])), axis=1)

赞(0）回复(0）举报 2023-02-26

zbdgwd5y3#

首先，迭代 Dataframe 是反模式的，因为在99%的情况下，有一个矢量化的方法对你要做的任务更有效。也就是说，如果你必须循环，一些方法比其他方法更有效。
要循环访问特定列，请使用items()：

for idx, value in df['exchange'].items():
    # do something

要迭代 Dataframe ，请使用itertuples()：

# e.g. to access the `exchange` values as in the OP
for idx, *row in df.itertuples():
    print(idx, row.exchange)

items()从Series创建zip对象，而itertuples()创建namedtuple，您可以在其中通过列名引用特定值。
itertuples比iterrows快得多。例如，对于具有50000行的帧，iterrows需要2.4秒来遍历每行，而itertuples需要62毫秒（大约快40倍）。由于这是一个循环，因此这种差异是恒定的，如果您的 Dataframe 较大，我们将查看几秒与几分钟之间的差异。

df = pd.concat([df]*10000, ignore_index=True)

%timeit list(df.itertuples())
# 62 ms ± 11 ms per loop (mean ± std. dev. of 7 runs, 10 loops each)

%timeit list(df.iterrows())
# 2.42 s ± 162 ms per loop (mean ± std. dev. of 7 runs, 10 loops each)

赞(0）回复(0）举报 2023-02-26

我来回答

python-3.x 按索引迭代 Dataframe

3条答案

相关问题

热门标签

最新问答