组合client_id重复的Pandasdf中的行的数据

dm7nw8vv 于 2022-11-05 发布在其他

关注(0)|答案(2)|浏览(124)

我已经合并了2个 Dataframe ，我想确保用户ID不重复，所有值都写在一行中，并且不重复。这是一个现成的 Dataframe ，但我需要编辑它，并删除重复。我附加了输入数据：
第一个
数字是不同的文档，按类型合并，concat，等等，但我没有找到明确的文章编辑。
因此，它应该如下所示：

client_id  rzd_revenue  auto_revenue  air_revenue          address
0        111       1093.0           0.0          0.0  Комсомольская 4
1        112       2810.0           0.0          0.0   Энтузиастов 8а
2        113      10283.0       57483.0          0.0  Левобережная 1а
3        114       5774.0          83.0          0.0          Мира 14
4        115        981.0         912.0         81.0        ЗЖБИиДК 1

pandas

来源：https://stackoverflow.com/questions/74322204/combine-data-from-lines-in-a-pandas-df-where-client-id-is-duplicated

2条答案

按热度按时间

iswrvxsc1#

如果可能的话，你应该选择连接，这样就不会出现重复行的问题。但是，如果你只得到了full_result而不是初始表，这可以通过使用groupby表达式来实现：

full_result.groupby("client_id").first().reset_index()

对于每个client_id，它取每列的第一个非空值，然后重置索引，使client_id再次成为另一列。

赞(0）回复(0）举报 2022-11-05

iaqfqrcu2#

你可以使用concat()来完成这个任务，只需要先设置索引：
第一个
然后连接client_base，你可以做一些类似的事情。
第一个
在这一点上，您可以.reset_index()，如果你想。
更多信息：

用户指南：Merge, join, concatenate and compare
Pandas Merging 101

赞(0）回复(0）举报 2022-11-05

我来回答

组合client_id重复的Pandasdf中的行的数据

2条答案

相关问题

热门标签

最新问答