我有一个以下列的数据框。每一行包含不同的格式字符串。
col |
----------------------
GRA/B
TPP
BBMY
...
SOCBBA 0 MAX
CMBD 0 MAX
EPR 5.75 MAX
...
PMUST 5.57643 02/15/34
LEO 0 12/30/2099
RGB 3.125 09/15/14
RGB 3.375 04/15/20
我想将所有日期转换为显示完整年份的格式。
有没有办法用正则表达式把它变成这样。
col |
----------------------
GRA/B
TPP
BBMY
...
SOCBBA 0 MAX
CMBD 0 MAX
EPR 5.75 MAX
...
PMUST 5.57643 02/15/2034
LEO 0 12/30/2099
RGB 3.125 09/15/2014
RGB 3.375 04/15/2020
现在我唯一能想到的就是
df['col'] = df['col'].str.replace('/14', '/2014')
对于每一年,但有很多年,它也将取代天和月以及。
我怎样才能正确地实现这一点,我应该使用正则表达式吗?
1条答案
按热度按时间bksxznpy1#
当它“以斜杠结尾,后跟2个数字”时,替换怎么样?
正则表达式:
/
:文字正斜杠(\d{2})
:捕获2位数字$
:字符串结束替代者:
/20
:正斜杠和20\1
:正则表达式中的第一个捕获组,即最后2位