pandas 基于几列删除存在于另一个pd.dataframe中的行？

hzbexzde 于 2023-03-11 发布在其他

关注(0)|答案(3)|浏览(161)

我有df a和df B，如果matchcolumns（颜色和值）同时存在于a和b中，我需要得到df c。
我目前掌握的情况：

c = a[a[matchcolumns] == b[matchcolumns]]

a
color value cost
red 0.1 5.99
blue 0.2 6.99
green 0.3 9.99

b
color value cost
red 0.1 0.9

c 
color value cost
blue 0.2 6.99
green 0.3 9.99

pandas

来源：https://stackoverflow.com/questions/75678110/remove-rows-that-exist-in-another-pd-dataframe-based-on-a-few-columns

3条答案

按热度按时间

0h4hbjxa1#

看看下面的代码是否给出了您要查找的结果

c = pd.merge(a, b, on=['color', 'value'], how='inner')
c.head()

赞(0）回复(0）举报 2023-03-11

mzsu5hc02#

使用带指示器的外部merge并删除公共行：

cols = ['color', 'value']

c = (a.merge(b[cols], on=cols,
             how='outer', indicator=True)
      .loc[lambda d: d.pop('_merge').ne('both')]
     )

或者，如果两个输入中没有重复项：

c = (
 pd.concat([a, b])
   .drop_duplicates(subset=cols, keep=False)
)

输出：

color  value  cost
1   blue    0.2  6.99
2  green    0.3  9.99

赞(0）回复(0）举报 2023-03-11

ykejflvf3#

mrg_idx = pd.merge(a[['color', 'value']],b[['color', 'value']]).index

print( a.iloc[mrg_idx] )

color  value  cost
0   red    0.1  5.99

赞(0）回复(0）举报 2023-03-11

我来回答

pandas 基于几列删除存在于另一个pd.dataframe中的行？

3条答案

相关问题

热门标签

最新问答