在pyspark中将mm-dd-yy,hr-mm-ss转换为yy-mm-dd时间戳

btxsgosb  于 2021-05-27  发布在  Spark
关注(0)|答案(1)|浏览(379)

这个问题在这里已经有答案了

将pyspark字符串转换为日期格式(6个答案)
spark dataframe列字符串到日期[重复](1个答案)
5个月前关门了。
我在pyspark dataframe中有一个字段,由时间(数据类型:sting)组成,格式为mm dd yy,hr mm ss。它看起来像:

+--------------------+
|timestamp       |
+-------------------- 
| 04-04-2019,18:34:38|    
| 04-05-2019,14:02:56|    
| 04-06-2019,01:06:08|    
| 04-06-2019,17:20:25|    
| 04-12-2019,23:33:46|

如何将此字段转换为类似yyyy-mm-dd的字符串,如“2019-04-04”?

bihw5rsg

bihw5rsg1#

使用 to_date() 格式为的函数
MM-dd-yyyy Example: ```
df.show()

+-------------------+

| timestamp|

+-------------------+

|04-04-2019,18:34:38|

+-------------------+

from pyspark.sql.functions import *

df.withColumn("date",to_date(col("timestamp"),"MM-dd-yyyy")).show()

+-------------------+----------+

| timestamp| date|

+-------------------+----------+

|04-04-2019,18:34:38|2019-04-04|

+-------------------+----------+

相关问题