我有以下 Dataframe :
corr_temp_df
[('vacationdate', 'date'),
('valueE', 'string'),
('valueD', 'string'),
('valueC', 'string'),
('valueB', 'string'),
('valueA', 'string')]
现在我想将vacationdate列的数据类型更改为String,这样 Dataframe 也会采用这个新类型并覆盖所有条目的数据类型数据。
corr_temp_df.dtypes
应覆盖vacationdate的数据类型。
我已经用过cast、StringType或astype之类的函数了,但都不成功。你知道怎么做吗?
1条答案
按热度按时间ozxc1zmp1#
让我们创建一些虚拟数据:
如果你的Spark〉= 1.5.0,你可以使用
date_format
函数:在Spark〈1.5.0中,可以使用Hive UDF完成:
当然它在Spark〉= 1.5.0中仍然可用。
如果不使用
HiveContext
,可以使用UDF模拟date_format
:请注意,它使用C标准格式,而不是Java simple date format