希望这不是一个愚蠢的问题...但我有一个项目,每隔大约一秒将数据记录到pandas df中,用于几列数字传感器值和一列时间戳。项目要求以5分钟的滚动平均值获取数据,运行一些故障检查,然后清除 Dataframe 。
如果我在故障检查后每5分钟清除一次数据(基本上只使用Pandas进行滚动平均功能),我仍然需要这个:
df['timestamp'] = pd.to_datetime(df['timestamp'])
df = df.set_index("timestamp")
df = df.rolling("5T").mean()
或者对于我的列,我可以只取列均值而不是最后5分钟的数据吗?
for col in df.columns:
print(f"df column: {col} - {df[col].mean()}")
现在我正在重新思考5分钟数据的5分钟滚动平均值是什么。我认为这是但可能是错误的,5分钟数据的5分钟滚动平均值将把数据框归结为表示前5分钟平均值的单行数据。
任何提示赞赏!也许Pandas是不是一个很好的应用程序,这只是使用一个列表会更好。
1条答案
按热度按时间hec6srdp1#
使用pandas resample将数据分组为不重叠的五分钟间隔,并使用mean()方法计算每个间隔内每列的平均值。