我已经合并了2个 Dataframe ,我想确保用户ID不重复,所有值都写在一行中,并且不重复。这是一个现成的 Dataframe ,但我需要编辑它,并删除重复。我附加了输入数据:
第一个
数字是不同的文档,按类型合并,concat,等等,但我没有找到明确的文章编辑。
因此,它应该如下所示:
client_id rzd_revenue auto_revenue air_revenue address
0 111 1093.0 0.0 0.0 Комсомольская 4
1 112 2810.0 0.0 0.0 Энтузиастов 8а
2 113 10283.0 57483.0 0.0 Левобережная 1а
3 114 5774.0 83.0 0.0 Мира 14
4 115 981.0 912.0 81.0 ЗЖБИиДК 1
2条答案
按热度按时间iswrvxsc1#
如果可能的话,你应该选择连接,这样就不会出现重复行的问题。但是,如果你只得到了
full_result
而不是初始表,这可以通过使用groupby
表达式来实现:对于每个
client_id
,它取每列的第一个非空值,然后重置索引,使client_id
再次成为另一列。iaqfqrcu2#
你可以使用
concat()
来完成这个任务,只需要先设置索引:第一个
然后连接
client_base
,你可以做一些类似的事情。第一个
在这一点上,您可以
.reset_index()
,如果你想。更多信息: