我有一个代码,它可以按小时显示两个日期/时间点之间某个位置的累计患者人数。但是,我想调整这个代码,以分钟为单位显示数据。
Datatable:
ID ARRIVAL_DATE_TIME DISPOSITION_DATE
1 2021-11-07 08:35:00 2021-11-07 17:58:00
2 2021-11-07 13:16:00 2021-11-08 02:52:00
3 2021-11-07 15:12:00 2021-11-07 21:08:00
Desired output:
ID DATE_HOUR_MIN_IN_ED
1 2021-11-07 08:35:00
1 2021-11-07 08:36:00
1 2021-11-07 08:37:00
.....
1 2021-11-07 17:58:00
...
2 2021-11-07 13:16:00
2 2021-11-07 13:17:00
2 2021-11-07 13:18:00
我怀疑我需要改变什么,我有FREQ等于,但不知道该放什么。
代码:
TEST['Date']=[pd.date_range(a,b , freq='H') for a , b in zip(TEST.ARRIVAL_DATE_TIME,TEST.DISPOSITION_DATE)]
s=TEST[['Date','ID']].explode('Date').reset_index(drop=True)
Create date/hour variable for each hour between two datetime variables
1条答案
按热度按时间nx7onnlm1#
从pandas docs“频率:str或DateOffset,默认值为'D'频率字符串可以有倍数,例如'5H'。有关频率别名的列表,请参见此处。”
“偏移别名为有用的常见时间序列频率提供了许多字符串别名。我们将这些别名称为偏移别名。”