你能在组上使用一个窗口函数吗,feature engine中的一些东西?我一直在阅读docs,并试图找到一些关于如何做到这一点的清晰度,但它似乎应该存在,但我似乎找不到它是如何实现的。
import pandas as pd
# create a sample dataframe with groups
df = pd.DataFrame({'group': ['A', 'A','A', 'B', 'B', 'B','B', 'C', 'C', 'C','C'],
'value': [1, 2, 3, 4, 5, 6, 7, 8,9,10,11]})
# group the data by the 'group' column and apply a rolling window mean of size 2
rolling_mean = df.groupby('group')['value'].rolling(window=2).mean()
print(rolling_mean)
我猜应该是这样的。
from feature_engine.timeseries.forecasting import WindowFeatures
wf = WindowFeatures(
window_size=3,
variables=["value"],
operation=["mean"],
groupby_cols=["group"]
)
transformed_df = wf.fit_transform(df)
我似乎在功能引擎中找不到group_by(groupby_cols)参数。
如果能看到其他标准化时间序列数据的特性工程的方法,那就太好了,也许来自sktime或其他框架。
1条答案
按热度按时间ipakzgxi1#
当您想对每个组单独应用此操作时,可以使用
groupby_apply
:输出: