Apache Spark 如何在scala中使用nvl函数

83qze16e  于 2023-01-05  发布在  Apache
关注(0)|答案(1)|浏览(256)

我尝试编写以下代码:
df.select第1栏(“标识”),0))
当我执行这个命令时,我得到一个错误值nvl not found。
请帮我解决这个问题。

1tuwyuhd

1tuwyuhd1#

在Spark中,它被称为coalesce,您可以查看article以了解更多细节

# create new column with non Null values
tmp = testDF.withColumn('newColumn', coalesce(testDF['id'], testDF['number']))

# Check the content of new df
tmp.show()

+----+------+---------+
|  id|number|newColumn|
+----+------+---------+
|   1|     1|        1|
|   2|     2|        2|
|null|     3|        3|
|   4|  null|        4|
+----+------+---------+

在您的情况下,它可能如下所示:

df.select(coalesce(col("id"),lit(0)))

相关问题