我正在尝试构建时间序列分析模型,并希望创建一些包含先前行的值的要素。
我有一个数据集如下:
| 项目标识|车间标识|件物品_已卖出|日期块标识|
| - -|- -|- -|- -|
| 一个|一个|五个|第0页|
| 一个|2个|10个|第0页|
| 一个|一个|七个|一个|
| 2个|2个|八个|一个|
| 2个|一个|五个|一个|
我想添加一个列,其中包含上一个日期块中每个商品/商店组合的商品销售额。
| 项目标识|车间标识|件物品_已卖出|日期块标识|lag 1_商品_已售|
| - -|- -|- -|- -|- -|
| 一个|一个|五个|第0页|第0页|
| 一个|2个|10个|第0页|第0页|
| 一个|一个|七个|一个|五个|
| 2个|2个|八个|一个|第0页|
| 2个|一个|五个|一个|第0页|
我认为,如果在某个日期段内没有销售,那么表中就不会出现该商品/商店组合的条目,这是一个很难解决的问题。我尝试了各种分组和移动的组合,但似乎无法得到我想要的结果。
2条答案
按热度按时间tkqqtvp11#
查看
df.shift
与groupby.docs的组合为班次here。代码为here的旧答案。下次尝试搜索SO,您可能会找到答案!
xwbd5t1u2#
试试看:
印刷品: