与其他问题不同,我不想用新值创建新列,我想使用同一列,只是将旧值改为新值(如果存在)。
对于一个新专栏,我会:
import pandas as pd
df1 = pd.DataFrame(data = {'Name' : ['Carl','Steave','Julius','Marcus'],
'Work' : ['Home','Street','Car','Airplane'],
'Year' : ['2022','2021','2020','2019'],
'Days' : ['',5,'','']})
df2 = pd.DataFrame(data = {'Name' : ['Carl','Julius'],
'Work' : ['Home','Car'],
'Days' : [1,2]})
df_merge = pd.merge(df1, df2, how='left', on=['Name','Work'], suffixes=('','_'))
print(df_merge)
Name Work Year Days Days_
0 Carl Home 2022 1.0
1 Steave Street 2021 5 NaN
2 Julius Car 2020 2.0
3 Marcus Airplane 2019 NaN
但我真正想要的正是这样:
Name Work Year Days
0 Carl Home 2022 1
1 Steave Street 2021 5
2 Julius Car 2020 2
3 Marcus Airplane 2019
我怎样才能建立这样一个联盟?
2条答案
按热度按时间bgibtngc1#
可以使用
combine_first
,预先将空字符串设置为NaNs(末尾的索引是重新排列列以匹配所需的输出):这将输出:
ggazkfy82#
可以使用
Series
的update
方法: