我有一个df,它有一个类似字符串的列,表示持续时间 PT2H
. 我想创建一个新的列minutes\u int,可以在scala中使用-
import java.time.Duration
Duration.parse('PT2H').toMinutes()
我怎样才能在整个专栏上做到这一点?我犯了错误-
jsonDF.withColumn("minutes_int", Duration.parse(col("duration_str")).toMinutes())
错误-
error: type mismatch;
found : org.apache.spark.sql.Column
required: CharSequence
我怎样才能解决这个问题?
1条答案
按热度按时间inkz8wg91#
您可以使用用户定义的函数来实现这一点,但请注意,这些函数并没有得到优化,因此您可以从编写自己的仅spark版本中获益。
然后使用它。。。
注意,您还可以注册它,以便在sql中使用它,即。