在pandas数据框架中的2个值之间拟合期望值?

y4ekin9u  于 2023-08-01  发布在  其他
关注(0)|答案(1)|浏览(108)

我有一个时间序列数据集,我想用LSTM训练它。我的数据集中的目标列是在实验过程中某个时间步的液体测量值。
例如:在第0时间步(实验开始),酒精浓度为0,当在一小时后再次测量时,我们观察到浓度现在为10。
因此,实验开始与一小时之前之间的时间步长具有值NaN,因为在该时间期间未测量酒精浓度。
我想用不需要精确的值来填充这些NaN,但是仅仅是一个估计值也可以。

示例数据集

Timestamp  concentration
10:15          0 
10:20          NaN
10:30          NaN
10:40          NaN
10:50          NaN
11:00          NaN
10:15          10

字符串
我想用可能适合0-10范围的一些值填充那些NaN,并类似地用2个浓度之间的这些值填充整个列。

7d7tgy0s

7d7tgy0s1#

试试interpolate()

df.set_index(pd.to_datetime(df['Timestamp']))['concentration'].interpolate()

字符串
输出量:

Timestamp
2023-07-26 10:15:00     0.000000
2023-07-26 10:20:00     1.666667
2023-07-26 10:30:00     3.333333
2023-07-26 10:40:00     5.000000
2023-07-26 10:50:00     6.666667
2023-07-26 11:00:00     8.333333
2023-07-26 10:15:00    10.000000

相关问题