pandas 当某些列具有相同的值时，将特定行中的值从一个DataFrame替换到另一个DataFrame

64jmpszr 于 2023-01-15 发布在其他

关注(0)|答案(2)|浏览(192)

与其他问题不同，我不想用新值创建新列，我想使用同一列，只是将旧值改为新值（如果存在）。
对于一个新专栏，我会：

import pandas as pd

df1 = pd.DataFrame(data = {'Name' : ['Carl','Steave','Julius','Marcus'], 
                           'Work' : ['Home','Street','Car','Airplane'],
                           'Year' : ['2022','2021','2020','2019'],
                           'Days' : ['',5,'','']})

df2 = pd.DataFrame(data = {'Name' : ['Carl','Julius'], 
                           'Work' : ['Home','Car'],
                           'Days' : [1,2]})

df_merge = pd.merge(df1, df2, how='left', on=['Name','Work'], suffixes=('','_'))
print(df_merge)

Name      Work  Year Days  Days_
0    Carl      Home  2022         1.0
1  Steave    Street  2021    5    NaN
2  Julius       Car  2020         2.0
3  Marcus  Airplane  2019         NaN

但我真正想要的正是这样：

Name      Work  Year Days
0    Carl      Home  2022    1
1  Steave    Street  2021    5
2  Julius       Car  2020    2
3  Marcus  Airplane  2019

我怎样才能建立这样一个联盟？

pandas

来源：https://stackoverflow.com/questions/75120012/replace-values-in-specific-rows-from-one-dataframe-to-another-when-certain-colum

2条答案

按热度按时间

bgibtngc1#

可以使用combine_first，预先将空字符串设置为NaNs（末尾的索引是重新排列列以匹配所需的输出）：

df1.loc[df1["Days"] == "", "Days"] = float("NaN")
df1.combine_first(df1[["Name", "Work"]].merge(df2, "left"))[df1.columns.values]

这将输出：

Name      Work  Year Days
0    Carl      Home  2022  1.0
1  Steave    Street  2021    5
2  Julius       Car  2020  2.0
3  Marcus  Airplane  2019  NaN

赞(0）回复(0）举报 2023-01-15

ggazkfy82#

可以使用Series的update方法：

df1.Days.update(pd.merge(df1, df2, how='left', on=['Name','Work']).Days_y)

赞(0）回复(0）举报 2023-01-15

我来回答

pandas 当某些列具有相同的值时，将特定行中的值从一个DataFrame替换到另一个DataFrame

2条答案

相关问题

热门标签

最新问答