替换pysparkDataframe中列中的空值

wbgh16ku  于 2021-05-27  发布在  Spark
关注(0)|答案(1)|浏览(566)

我需要替换spark dataframe中列中的空值。下面是我尝试的代码

df=df.na.fill(0,Seq('c_amount')).show()

但这给了我一个错误 NameError: name 'Seq' is not defined 下面是我的table

+------------+--------+
   |c_account_id|c_amount|
   +------------+--------+ 
   |           1|    null|    
   |           2|    123 |
   |           3|    null|
   +------------+--------+

预期产量

+------------+--------+
   |c_account_id|c_amount|
   +------------+--------+ 
   |           1|       0|    
   |           2|     123|
   |           3|       0|
   +------------+--------+
rks48beu

rks48beu1#

你需要像这样使用

df = df.fillna("<BLANK>", subset=['col_name'])

相关问题