如何将不完整的时间序列转换为完整的时间序列(pandas)

xn1cxnb4  于 2023-04-04  发布在  其他
关注(0)|答案(1)|浏览(144)

我有一些不完整的时间序列数据(时间戳是随机间隔的)。如何在不更改关键时间戳的情况下将数据转换为固定间隔的数据?
以下是正在讨论的时间序列数据的一个小样本:

Date/Time,Cmltv Net Profit
2013-05-28 00:00:00,-14000.0
2013-05-30 00:00:00,-14000.0
2013-05-30 00:00:00,-24200.0
2013-06-07 00:00:00,-38200.0
2013-06-07 00:00:00,-11200.0
2013-06-24 00:00:00,-49400.0
2013-06-24 00:00:00,-13800.0

任何见解都是有帮助的。我没有尝试任何东西,只是因为我不知道在哪里甚至寻找一个解决方案。

gcuhipw9

gcuhipw91#

如果需要Date/Time的唯一值,可以使用DataFrame.resamplesum来聚合重复的日期时间:

df1 = df.resample('D', on='Date/Time').sum().reset_index()
print (df1)
    Date/Time  Cmltv Net Profit
0  2013-05-28          -14000.0
1  2013-05-29               0.0
2  2013-05-30          -38200.0
3  2013-05-31               0.0
4  2013-06-01               0.0
5  2013-06-02               0.0
6  2013-06-03               0.0
7  2013-06-04               0.0
8  2013-06-05               0.0
9  2013-06-06               0.0
10 2013-06-07          -49400.0
11 2013-06-08               0.0
12 2013-06-09               0.0
13 2013-06-10               0.0
14 2013-06-11               0.0
15 2013-06-12               0.0
16 2013-06-13               0.0
17 2013-06-14               0.0
18 2013-06-15               0.0
19 2013-06-16               0.0
20 2013-06-17               0.0
21 2013-06-18               0.0
22 2013-06-19               0.0
23 2013-06-20               0.0
24 2013-06-21               0.0
25 2013-06-22               0.0
26 2013-06-23               0.0
27 2013-06-24          -63200.0

如果需要避免聚合重复的日期时间,请使用带有辅助程序DataFrame的左连接:
x一个一个一个一个x一个一个二个x

相关问题