我有一个 Dataframe ,看起来像这样:
ID RESULT
1 Pivot (Triage) Form Entered On: 12/30/2022 23:20 EST Performed On: 12/30/2022 23:16 EST
我想提取这两个datetime变量,这样新的dataframe看起来就像这样:
ID END_TIME START_TIME
1 12/30/2022 23:20 12/30/2022 23:16
我尝试了多种方法,但得到的结果是'END_TIME'
和'START_TIME'
变量输出为"NA
"。
TEST['END_TIME']=TEST['RESULT'].str.extract("Entered On: (\d+) EST")
TEST['START_TIME']=TEST['RESULT'].str.extract("Performed On: (\d+) EST")
2条答案
按热度按时间ecfsfe2w1#
我们在应用regex函数之前构建以下 Dataframe (我假设结束日期总是在开始日期之前):
您可以在代码中使用下面的regex,或者使用下面的代码(它最适合您)
regex = r'\d{2}\/\d{2}\/\d{4} \d{2}:\d{2}'
agxfikkp2#
假设总是有2个且只有2个时间戳,并使用更通用的正则表达式模式,我们可以尝试:
以下regex demo显示regex模式和捕获组工作正常。