scala Spark withColumn空默认值[重复]

bihw5rsg  于 2023-08-05  发布在  Scala
关注(0)|答案(1)|浏览(113)

此问题在此处已有答案

Create new Dataframe with empty/null field values(2个答案)
17天前关闭。
我试图添加一个新的String列到一个默认值为null的dataframe(稍后将应用一个非null值)
这是我的代码

.withColumn("column-name", lit(null: String))

字符串
这将创建一个我不想要的Void类型的列
创建默认值为null的String类型列的最简单方法是什么?
注意,这组工作的结构是固定不变的,我很快就要离开这家公司了,所以我对争论代码应该重新构造没有兴趣,我只想以最少的大惊小怪给予他们他们所要求的代码
还要注意,我们并没有在任何地方使用代码定义的模式,它是纯模式推断

ttcibm8c

ttcibm8c1#

您可以将litnull一起使用,然后将其转换为所需的类型。
Example

df.withColumn("test", lit(null).cast(StringType))

字符串
Output

+---+----+
|id |test|
+---+----+
|1  |null|
|2  |null|
|3  |null|
+---+----+


Schema

root
 |-- id: integer (nullable = false)
 |-- test: string (nullable = true)


祝你好运!

相关问题