使用pyspark在withcolumn(“mycolumn”,myenum.giraffe)中的“python枚举”的最佳方法

mspsb9vt  于 2021-07-14  发布在  Spark
关注(0)|答案(1)|浏览(273)

我想这样做:

myEnum = Enum("myEnum", "Giraffe Crab Rat Human")

df_new = df.withColumn("AnimalEnumValueColumn", myEnum.Giraffe)

(我知道这是不正确的,但我想要一个具有相同预期效果的替代解决方案)

htrmnn0y

htrmnn0y1#

你需要使用 .value 要从枚举对象获取值,请执行以下操作:

import pyspark.sql.functions as F

df_new = df.withColumn("AnimalEnumValueColumn", F.lit(myEnum.Giraffe.value))

有关详细信息,请参阅enum文档。

相关问题