我有一个可能很大的 Dataframe ,其中包含来自日期范围查询的日期时间,如下所示:
0 2022-11-20 00:02:22.630968+00:00
1 2022-11-23 00:03:02.134938+00:00
2 2022-11-23 00:03:50.589251+00:00
3 2022-11-26 00:05:17.568843+00:00
4 2022-11-26 00:05:22.653905+00:00
5 2022-11-26 00:05:22.653905+00:00
6 2022-11-26 00:05:22.653905+00:00
我需要重新塑造成一个日期列表中的日期出现次数在第二行,没有日期出现必须为零填充如下:
2022-11-20 1
2022-11-21 0
2022-11-22 0
2022-11-23 2
2022-11-24 0
2022-11-25 0
2022-11-26 4
什么是最有效的方法来实现这一点与Pandas?
如果这有用的话,最终目标是将这些数据提供给Calplot。
谢啦,谢啦
3条答案
按热度按时间kyks70gy1#
out是一个
pd.Series
,其中日期作为索引,计数作为值:sqserrrh2#
您可以使用
date_range
在原始 Dataframe 中构建一个从最小值到最大值的日期范围,然后使用该范围创建一个 Dataframe ,然后将日期Map到从原始df构建的value_counts()
系列。假设您的原始 Dataframe 是
df
,包含日期的列是date
,那么您可以执行以下操作:6ojccjat3#
假设
df
是您的 Dataframe ,Datetime
是列名,下面是关于pandas.Series.reindex
的命题:输出: