我有一个包含分组、日期和值列的数据框。我的日期是每月一次。由于我的2020年数据受到Covid的影响,我想用2020年和2021年的平均值插补它。在数据框中,我如何执行此操作?
input = pd.DataFrame({
'group': ['A', 'A', 'A','A', 'B','B','B','B','A','B'],
'date': ['2020-01-31', '2021-01-31', '2020-03-31','2021-03-31', '2020-01-31', '2021-01-31', '2020-03-31','2021-03-31','2022-01-31', '2022-02-28'],
'value': [10, 20, 30, 40,0, 20, 20, 40,10, 20 ]
})
期望输出
output= pd.DataFrame({
'group': ['A', 'A', 'A','A', 'B','B','B','B','A','B'],
'date': ['2020-01-31', '2021-01-31', '2020-03-31','2021-03-31', '2020-01-31', '2021-01-31', '2020-03-31','2021-03-31','2022-01-31', '2022-02-28'],
'value': [15, 20, 35, 40, 10, 20, 30, 40,10, 20 ]
})
1条答案
按热度按时间bbuxkriu1#
用途: