如何替换pysparkDataframe中的特定值

enyaitl3  于 2021-07-12  发布在  Spark
关注(0)|答案(0)|浏览(270)

这个问题在这里已经有答案了

不同于rdd和Dataframe的浮点精度(1个答案)
如何基于pyspark中基于另一列的表达式求值有条件地替换列中的值(1个答案)
上个月关门了。
我试图替换一个特定的值是pyspark dataframe。虽然我知道pysparkDataframe是不可变的,但是有什么方法可以做到吗?
我有一个这样的Dataframe

+-------+-----------------+
|summary|              Age|
+-------+-----------------+
|  count|                4|
|   mean|             22.0|
| stddev|1.414213562373095|
|    min|               21|
|    max|               24|
+-------+-----------------+

我想把'1.414213562373095'改成'1.4142135623730951'。
我尝试了以下方法,但都出现了错误:
1)

col=[4,22.0,1.4142135623730951,21,24]
    pf=pf.withColumn('Age',col)

2) `pf[2][0]=1.4142135623730951`
``` `pf[pf.Age==1.414213562373095]=1.4142135623730951` 

暂无答案!

目前还没有任何答案,快来回答吧!

相关问题