我尝试编写以下代码:df.select第1栏(“标识”),0))当我执行这个命令时,我得到一个错误值nvl not found。请帮我解决这个问题。
1tuwyuhd1#
在Spark中,它被称为coalesce,您可以查看article以了解更多细节
# create new column with non Null values tmp = testDF.withColumn('newColumn', coalesce(testDF['id'], testDF['number'])) # Check the content of new df tmp.show() +----+------+---------+ | id|number|newColumn| +----+------+---------+ | 1| 1| 1| | 2| 2| 2| |null| 3| 3| | 4| null| 4| +----+------+---------+
在您的情况下,它可能如下所示:
df.select(coalesce(col("id"),lit(0)))
1条答案
按热度按时间1tuwyuhd1#
在Spark中,它被称为coalesce,您可以查看article以了解更多细节
在您的情况下,它可能如下所示: