Pandas将字典连接到 Dataframe

aiazj4mn  于 2023-02-14  发布在  其他
关注(0)|答案(3)|浏览(112)

我有一个现有的 Dataframe ,我尝试连接一个字典,其中字典的长度与 Dataframe 不同

A        B        C
0  0.46324  0.32425  0.42194
1  0.10596  0.35910  0.21004
2  0.69209  0.12951  0.50186
3  0.04901  0.31203  0.11035
4  0.43104  0.62413  0.20567
5  0.43412  0.13720  0.11052
6  0.14512  0.10532  0.05310

以及

test = {"One": [0.23413, 0.19235, 0.51221], "Two": [0.01293, 0.12235, 0.63291]}

我尝试将test添加到df,同时将键更改为"D""C",我查看了https://pandas.pydata.org/pandas-docs/stable/user_guide/merging.htmlhttps://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.concat.html,这表明我应该能够将字典连接到 Dataframe
我试过了

pd.concat([df, test], axis=1, ignore_index=True, keys=["D", "E"])
pd.concat([df, test], axis=1, ignore_index=True)

但我没有任何运气,我试图达到的结果是

A        B        C        D        E
0  0.46324  0.32425  0.42194  0.23413  0.01293  
1  0.10596  0.35910  0.21004  0.19235  0.12235
2  0.69209  0.12951  0.50186  0.51221  0.63291
3  0.04901  0.31203  0.11035      NaN      NaN
4  0.43104  0.62413  0.20567      NaN      NaN 
5  0.43412  0.13720  0.11052      NaN      NaN
6  0.14512  0.10532  0.05310      NaN      NaN
rnmwe5a2

rnmwe5a21#

假设要将它们添加为行:

>>> pd.concat([df, pd.DataFrame(test.values(), columns=df.columns)], ignore_index=True)
         A        B        C
0  0.46324  0.32425  0.42194
1  0.10596  0.35910  0.21004
2  0.69209  0.12951  0.50186
3  0.04901  0.31203  0.11035
4  0.43104  0.62413  0.20567
5  0.43412  0.13720  0.11052
6  0.14512  0.10532  0.05310
7  0.01293  0.12235  0.63291
8  0.23413  0.19235  0.51221

如果作为新列添加:

df_new = pd.concat([df, pd.DataFrame(test.values()).T], ignore_index=True, axis=1)
df_new.columns = \
    df.columns.tolist() + [{'One': 'D', 'Two': 'E'}.get(k) for k in test.keys()]

>>> df_new
         A        B        C        E        D
0  0.46324  0.32425  0.42194  0.01293  0.23413
1  0.10596  0.35910  0.21004  0.12235  0.19235
2  0.69209  0.12951  0.50186  0.63291  0.51221
3  0.04901  0.31203  0.11035      NaN      NaN
4  0.43104  0.62413  0.20567      NaN      NaN
5  0.43412  0.13720  0.11052      NaN      NaN
6  0.14512  0.10532  0.05310      NaN      NaN

在字典中不能保证顺序(例如test),因此实际上需要将新列名Map到键。

7gyucuyw

7gyucuyw2#

您可以做到这一点的唯一方法是:

df.join(pd.DataFrame(test).rename(columns={'One':'D','Two':'E'}))

          A       B       C       D       E
0   0.46324 0.32425 0.42194 0.23413 0.01293
1   0.10596 0.35910 0.21004 0.19235 0.12235
2   0.69209 0.12951 0.50186 0.51221 0.63291
3   0.04901 0.31203 0.11035     NaN     NaN
4   0.43104 0.62413 0.20567     NaN     NaN
5   0.43412 0.13720 0.11052     NaN     NaN
6   0.14512 0.10532 0.05310     NaN     NaN

因为正如@ Alexandria 正确提到的,连接的行数应该匹配,否则,就像您的情况一样,缺少的行将用NaN填充

qfe3c7zg

qfe3c7zg3#

要将字典添加为新列,另一种方法是将其转换为 Dataframe 并简单地赋值。

df[['D', 'E']] = pd.DataFrame(test)

要将字典添加为新行,另一种方法是使用from_dict方法将字典转换为 Dataframe 并进行连接。

df = pd.concat([df, pd.DataFrame.from_dict(test, orient='index', columns=df.columns)], ignore_index=True)

相关问题