我正在创建以下Dataframe
syncs.select($"event.timestamp",to_date($"event.timestamp".cast(TimestampType))).show
这包括以下行
timestamp|to_date(CAST(`event.timestamp` AS TIMESTAMP))|
-------------+---------------------------------------------+
1589509800768| 52339-07-25|
1589509802730| 52339-07-25|
1589509809092| 52339-07-25|
1589509810402| 52339-07-25|
1589509812112| 52339-07-25|
1589509817489| 52339-07-25|
1589509818065| 52339-07-25|
1589509818902| 52339-07-25|
1589509819020| 52339-07-25|
1589509819425| 52339-07-25|
1589509819830| 52339-07-25|
基于此 1589509800768
是2020年5月15日星期五02:30:00。
我不明白为什么我会得到这些未来的日期。从时间戳到日期的转换是否也需要某种日期格式?
2条答案
按热度按时间ql3eal8s1#
首先,应该将秒传递到毫秒,然后转换为时间戳或日期
lrpiutwd2#
spark需要以秒为单位的epoch时间,而不是毫秒,因此可以将它除以1000。