我有一个Pandas数据框,其中包括人力资源数据。对于每个人,有一些记录,我想合并的基础上'VALID_FROM'列。每行应包含一个单一的VALID_FROM与多个VALID_TO和CODE值。
下面是我正在研究的一个例子:
ID NAME FAMILY VALID_FROM VALID_TO CODE
000 Mike Jones 2023-03-01 2260-01-01 115
000 Mike Jones 2023-03-01 2260-01-01 102
000 Mike Jones 2022-11-01 2023-02-28 102
000 Mike Jones 2023-03-01 2260-01-01 101
000 Mike Jones 2022-10-01 2022-10-31 102
000 Mike Jones 2022-10-01 2022-10-31 115
000 Mike Jones 2022-11-01 2023-02-28 115
000 Mike Jones 2022-10-01 2023-02-28 101
这是我想要的
ID NAME FAMILY VALID_FROM_1 VALID_TO_1 CODE_1 VALID_TO_2 CODE_2 VALID_TO_3 CODE_3
000 Mike Jones 2022-10-01 2022-10-31 102 2022-10-31 115 2023-02-28 101
000 Mike Jones 2022-11-01 2023-02-28 102 2023-02-28 115 n/a n/a
000 Mike Jones 2023-03-01 2260-01-01 101 2260-01-01 102 2260-01-01 115
解决这个问题的最好方法是什么?我已经研究过groupby()函数,但我仍然不太理解它。
1条答案
按热度按时间cnh2zyt31#
您可以尝试使用
df
Dataframe 执行以下操作:您的样本结果: