我使用下面的代码得到一个Dataframe,但得到错误。如果将从代码中删除case语句,那么它就可以正常工作。
from pyspark.sql import functions as F
ivr_icm_cfs_lookup = spark.table("sample_table").where(F.col("tier") == "Servicing").select("fig","fig_bu","tier") .withColumn("fig",F.regexp_replace(F.col("fig"),"[^0-9a-zA-Z]",' ')).withColumn("fig_bu",F.when((F.col("fig_bu") == 'OPEN' & F.col("tier") == 'Academy', F.upper("tier")).otherwise(F.col("fig_bu"))))
1条答案
按热度按时间mctunoxg1#
先生,你的支架有问题。现在试试
如果这确实不适合您,那么您可以尝试sparksql,方法是将dataframe注册为table,然后在sql中编写案例。
这样可以添加所需的列。