我有一个pandas dataframe,其中包含一列日期,表示论坛帖子的发布时间['post_month],范围从2017年11月到2023年1月。我想从这些创建一个新的'period'列,表示帖子发布的时间段。因此,2017年11月发布的帖子将是period(或月份)= 1,2017年12月期间(或月份)= 2,2018年1月,期间(或月份)= 3等等......直到2023年1月的最后一个期间。
最合适的方法是什么?
我的数据如下所示:
| 年龄|二进制目标|后月|同群|
| --------------|--------------|--------------|--------------|
| 六十三|0|2018年4月1日|二○一九年|
| 三十四|0|2019年2月1日|二○一九年|
| 四十四|1|2018-09-01 2018-09-01|2017年|
| 二十七|0|2018-03-01 2018-03-01|2022|
1条答案
按热度按时间pgvzfuti1#
您可以转换
to_period
,减去您的引用并获得周期数:替代矢量解决方案:
输出: