我有一个panda Dataframe ,包含以下列:
Posting Date
从2018-01-01(yyyy-mm-dd)到2022-10-30(yyyy-mm-dd)我想按Material
和Posting Date
日期对 Dataframe 进行分组,粒度为1个月,对于Posting Date
范围内的月份,用零填充Total_Sum。
Material Posting Date Total_Sum
0 E7400R101012 2018-01 0
1 E7400R101012 2018-02 0
2 E7400R101012 2018-03 0
3 E7400R101012 2018-04 0
4 E7400R101012 2018-05 0
5 E7400R101012 2018-06 2
6 E7400R101012 2018-07 0
7 E7400R101012 2018-08 0
8 E7400R101012 2018-09 0
9 E7400R101012 2018-10 0
10 E7400R101012 2018-11 3
11 E7400R101012 2018-12 0
-- ---
nn E7400R101012 2022-10 0
nn NEW CODE 2018-01 0
1条答案
按热度按时间uxhixvfz1#
按
Series.dt.to_period
将列Posting Date
转换为月周期,因此可以按最小值和最大值创建period_range
,并创建MultiIndex.from_product
。然后聚合
sum
并按DataFrame.reindex
添加缺失对: