组合client_id重复的Pandasdf中的行的数据

dm7nw8vv  于 2022-11-05  发布在  其他
关注(0)|答案(2)|浏览(124)

我已经合并了2个 Dataframe ,我想确保用户ID不重复,所有值都写在一行中,并且不重复。这是一个现成的 Dataframe ,但我需要编辑它,并删除重复。我附加了输入数据:
第一个
数字是不同的文档,按类型合并,concat,等等,但我没有找到明确的文章编辑。
因此,它应该如下所示:

client_id  rzd_revenue  auto_revenue  air_revenue          address
0        111       1093.0           0.0          0.0  Комсомольская 4
1        112       2810.0           0.0          0.0   Энтузиастов 8а
2        113      10283.0       57483.0          0.0  Левобережная 1а
3        114       5774.0          83.0          0.0          Мира 14
4        115        981.0         912.0         81.0        ЗЖБИиДК 1
iswrvxsc

iswrvxsc1#

如果可能的话,你应该选择连接,这样就不会出现重复行的问题。但是,如果你只得到了full_result而不是初始表,这可以通过使用groupby表达式来实现:

full_result.groupby("client_id").first().reset_index()

对于每个client_id,它取每列的第一个非空值,然后重置索引,使client_id再次成为另一列。

iaqfqrcu

iaqfqrcu2#

你可以使用concat()来完成这个任务,只需要先设置索引:
第一个
然后连接client_base,你可以做一些类似的事情。
第一个
在这一点上,您可以.reset_index(),如果你想。
更多信息:

相关问题