pandas 合并两个不同长度的python panda数据框，但保留输出数据框中的所有行

ghhkc1vu 于 2022-12-28 发布在 Python

关注(0)|答案(4)|浏览(214)

我有以下问题：我有两个不同长度的Pandas数据框，其中一些行和列具有相同的值，另一些则不同，如下所示：

df1:                                 df2:

      Column1  Column2  Column3           ColumnA  ColumnB ColumnC
    0    a        x        x            0    c        y       y
    1    c        x        x            1    e        z       z
    2    e        x        x            2    a        s       s
    3    d        x        x            3    d        f       f
    4    h        x        x
    5    k        x        x

我现在要做的是合并这两个 Dataframe ，这样，如果ColumnA和Column1具有相同的值，则df2中的行将被追加到df1中的相应行，如下所示：

df1:
    Column1  Column2  Column3  ColumnB  ColumnC
  0    a        x        x        s        s
  1    c        x        x        y        y
  2    e        x        x        z        z
  3    d        x        x        f        f
  4    h        x        x        NaN      NaN
  5    k        x        x        NaN      NaN

我知道合并是可行的

df1.merge(df2,left_on='Column1', right_on='ColumnA')

但是这个命令删除了两个文件中Column1和ColumnA中所有不相同的行。相反，我希望将这些行保留在df1中，并在其他行具有来自df2的值的列中将NaN赋给它们，如上所示。在Pandas中有没有平滑的方法可以做到这一点？

pandas

来源：https://stackoverflow.com/questions/33086881/merge-two-python-pandas-data-frames-of-different-length-but-keep-all-rows-in-out

4条答案

按热度按时间

iqih9akk1#

您可以在此处阅读文档：http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.merge.html
您要查找的是左联接。默认选项是内联接。您可以通过传递不同的how参数来更改此行为：

df1.merge(df2,how='left', left_on='Column1', right_on='ColumnA')

赞(0）回复(0）举报 2022-12-28

7xllpg7q2#

看起来您正在查找类似左连接的内容。请查看以下示例是否有帮助：http://pandas.pydata.org/pandas-docs/stable/comparison_with_sql.html#left-outer-join
基本上可以将一个名为how='left'的参数传递给merge()

赞(0）回复(0）举报 2022-12-28

euoag5mw3#

您可以简单地将merge与using on和list一起使用

result = df1.merge(df2, on=['Column1'])

有关详细信息，请访问link

赞(0）回复(0）举报 2022-12-28

s4n0splo4#

用“concat”怎么样？
Dataframe列内容无需相同/匹配，它将追加。

import pandas as pd
from io import StringIO

csvfile = StringIO(
"""Column1  Column2 Column3
a   x   x
c   x   x
e   x   x
d   x   x
h   x   x
k   x   x
""")
    
csvfile_1 = StringIO(
"""ColumnA  ColumnB ColumnC
c   y   y
e   z   z
a   s   s
d   f   f
""")

df = pd.read_csv(csvfile, sep = '\t', engine='python')
df_1 = pd.read_csv(csvfile_1, sep = '\t', engine='python')

df_1 = df_1.rename({'ColumnA':'Column1'}, axis='columns')
    
df.set_index('Column1',inplace=True)
df_1.set_index('Column1',inplace=True)
    
# column contents no need to be the same, it will append
df_final = pd.concat([df,df_1],axis=1,sort=False).reset_index()

print (df_final)

输出为：

index Column2 Column3 ColumnB ColumnC
0     a       x       x       s       s
1     c       x       x       y       y
2     e       x       x       z       z
3     d       x       x       f       f
4     h       x       x     NaN     NaN
5     k       x       x     NaN     NaN

赞(0）回复(0）举报 2022-12-28

我来回答

pandas 合并两个不同长度的python panda数据框，但保留输出数据框中的所有行

4条答案

相关问题

热门标签

最新问答