我是编程新手。几个月前刚开始,我希望能得到一些帮助。
我有一个航班延误数据集,列为“年”、“月”、“月日”、“周日”和“CRSDepTime”,数据类型为int 64。
Screenshot of df
我需要执行分析和可视化,以确定延迟最少的月份、日期和时间。
你建议把所有的数据类型都转换成日期时间吗?我可以使用Pandas的to_datetime()函数吗?如果可以,格式应该是什么?
提前感谢!:)
我试探着:
df['CRSDepTime'] = pd.to_datetime(df['CRSDepTime'], format='HHMM')
但我不太确定的格式,它总是给:值错误:时间数据'1605'与格式'HHMM'不匹配(匹配)
2条答案
按热度按时间5tmbdcev1#
使用
to_datetime
与format
通过%H%M
进行匹配HHMM
和errors='coerce'
与NaT
如果无法解析次数,最后使用Series.dt.time
:对于需要
to_datetime
的日期时间的矢量化解决方案,只需要Day
列名并添加Hour
和Minute
列:性能:
tgabmvqs2#
假设这些都是整数,您可以通过以下方式获取该行得单个时间戳:
输出量: