pandas 我该如何着手修复我的.xlxs文件中的以下混乱日期

z0qdvdin  于 2023-05-21  发布在  其他
关注(0)|答案(1)|浏览(121)

我有下面的.xlxs文件,我已经上传到谷歌驱动器here上,有10个不同的日期,我正在尝试pandas.to_datetime来清理我的混乱日期。然而,我意识到该函数有一些限制,特别是我在第2行(1414/01/2019)和第3行(110/05/2019)中的日期。显然,我想将第2行和第3行的日期分别固定为(14/01/2019)和(11/05/2019)。但是,如果不能做到这一点,有没有一种方法可以跳过那些日期格式不能用pandas.to_datetime修复的行?

import pandas as pd

test=pd.read_excel('Messy_Dates.xlsx', usecols=[0], header=None, skiprows = [0])
yqkkidmi

yqkkidmi1#

to_datetimedayfirst=Trueerrors='coerce'一起使用,因此可以删除Series.dropna无法解析的日期时间:

test=pd.read_excel('Messy_Dates.xlsx', usecols=[0], header=None, skiprows = [0])

out = pd.to_datetime(test[0], dayfirst=True, errors='coerce').dropna()
print (out)
0   2018-05-16
1   2018-05-17
4   2019-05-22
5   2019-05-24
6   2019-05-25
7   2019-05-28
Name: 0, dtype: datetime64[ns]

相关问题