我有一个带有时间戳值的 Dataframe ,如下所示:2018-02- 15 T11:39:13.000Z我想使用Pyspark将其转换为UNIX格式。
我尝试了类似data = datasample.withColumn('timestamp_cast', datasample['timestamp'].cast('date'))
的方法,但是我丢失了很多信息,因为当我的源代码中有毫秒级的信息时,我只能得到日/月/年。
结果:2018-02-15
有什么想法得到unix和保持精度?谢谢!
2条答案
按热度按时间eyh26e7m1#
你可以使用内置在
unix_timestamp
中的下列方法:或者
n3ipq98p2#
另一种可能的方法是直接将
cast
列转换为整型