请协助我在清理我的日期类型在Python。
我的示例数据如下:
| 开始日期|日期切割|给出日期|
| - -|- -|- -|
| 2022年7月1日|二零二二年七月二十一日|二零二二年七月十一日|
| 二零二二年七月十七日|2022年7月16日|2022年7月21日|
| 二○二二年七月十六日|2022年7月1日|2022年7月9日|
| 二〇二二年七月十九日|二零二二年七月三十一日|二零二二年七月二十七日|
如何删除不同列中日期的所有短划线/斜杠/连字符?我有8列300行。
"我尝试过的“
df[['INITIATION DATE', 'DATE CUT', 'DATE GIVEN']]= df[['INITIATION DATE', 'DATE CUT', 'DATE GIVEN']].apply(pd.to_datetime, format = '%d%b%Y')
所有所需的输出格式:二零二二年七月一日
得到的值错误:
时间数据“2022年7月18日”与格式“%d-%B-%Y”不匹配(匹配)
2条答案
按热度按时间t2a7ltrp1#
要从字符串中删除所有的破折号/斜杠/连字符,可以使用
replace
方法:如果还需要将字符串转换为日期时间,请尝试以下操作:
qni6mghb2#
您可以使用pd.to_datetime将字符串转换为日期时间对象。该函数采用
format
参数,该参数使用常用的格式代码指定日期时间字符串的格式输出
出现该错误是因为日期时间字符串(例如
'18 July 2022'
)与格式说明符('%d-%b-%Y'
)不匹配,原因是格式说明符中存在额外的连字符。