def autoconvert_datetime(value):
formats = ['%m/%d/%Y', '%m-%d-%y'] # formats to try
result_format = '%d-%m-%Y' # output format
for dt_format in formats:
try:
dt_obj = datetime.strptime(value, dt_format)
return dt_obj.strftime(result_format)
except Exception as e: # throws exception when format doesn't match
pass
return value # let it be if it doesn't match
df['date'] = df['date'].apply(autoconvert_datetime)
6条答案
按热度按时间yptwkmov1#
最简单的方法是使用
to_datetime
:它还为欧洲时报提供了一个
dayfirst
的论据(但要小心this isn't strict)。以下是它的实际应用:
可以传递特定格式:
5m1hhzi42#
如果您的日期列是一个格式为'2017-01-01'的字符串,您可以使用pandas类型将其转换为datetime。
或者,如果需要“天”精度而不是“纳秒”精度,则使用datetime 64 [D
收益率
与使用pandas.to日期时间时相同
您可以尝试使用“%Y-%m-%d”以外的其他格式,但至少此格式有效。
ar5n3qh53#
如果要指定复杂的格式,可以使用以下命令:
有关
format
的更多详细信息,请访问:nhn9ugyo4#
如果您的日期格式混合在一起,不要忘记设置
infer_datetime_format=True
以简化工作。df['date'] = pd.to_datetime(df['date'], infer_datetime_format=True)
来源:pd.to_日期时间
或者,如果您需要定制的方法:
q7solyqu5#
尝试此解决方案:
'2022–12–31 00:00:00' to '2022–12–31 00:00:01'
pandas.to_datetime(pandas.Series(['2022–12–31 00:00:01']))
2022–12–31 00:00:01
tktrz96b6#
多个日期时间列
如果要将多个字符串列转换为datetime,则使用
apply()
会很有用。您可以将参数作为kwargs传递给
to_datetime
。使用
format=
加快速度如果列包含一个time组件,并且您知道datetime/time的格式,那么显式传递格式将显著加快转换速度。然而,如果列只有date,则几乎没有任何区别。在我的项目中,对于一个有500万行的列,差异是巨大的:约2.5分钟与6秒。
结果表明显式指定格式大约快了25倍,下面的运行时图显示了性能上的巨大差距,这取决于是否传递了格式。
用于生成图的代码: