让我们在python中得到如下两个DataFrame:
df:
| 代码_1|其他|
| - -|- -|
| 小行星19001|白色|
| 小行星19009|蓝色的|
| 小行星19008|红色的|
df_1:
| 代码_1|代码_2|
| - -|- -|
| 小行星19001|第00001号|
| 小行星19001|第00002号|
| 小行星19009|第00003号|
| 小行星19008|第00001号|
我想将df与df_1合并:
df_merge = pd.merge(df, df_1, how="left", on=['code_1'])
df_合并:
| 代码_1|其他|代码_2|
| - -|- -|- -|
| 小行星19001|白色|第00001号|
| 小行星19001|白色|第00002号|
| 小行星19009|蓝色的|第00003号|
| 小行星19008|红色的|第00004号|
我希望合并删除code_1中的重复项,并且只对第一行进行合并。我可以对[other,code_1]执行drop_duplicates,但我想知道是否可以在合并函数中包含一些参数来直接执行此操作。
预期结果:
| 代码_1|其他|代码_2|
| - -|- -|- -|
| 小行星19001|白色|第00001号|
| 小行星19009|蓝色的|第00003号|
| 小行星19008|红色的|第00004号|
1条答案
按热度按时间ldioqlga1#
在我看来,
pandas.merge()
没有符合您需要的特定参数,但是您可以在合并之前删除重复项来减少结果,假设df_1
中只有重复项: