这个问题在这里已经有答案了:
不同于rdd和Dataframe的浮点精度(1个答案)
如何基于pyspark中基于另一列的表达式求值有条件地替换列中的值(1个答案)
上个月关门了。
我试图替换一个特定的值是pyspark dataframe。虽然我知道pysparkDataframe是不可变的,但是有什么方法可以做到吗?
我有一个这样的Dataframe
+-------+-----------------+
|summary| Age|
+-------+-----------------+
| count| 4|
| mean| 22.0|
| stddev|1.414213562373095|
| min| 21|
| max| 24|
+-------+-----------------+
我想把'1.414213562373095'改成'1.4142135623730951'。
我尝试了以下方法,但都出现了错误:
1)
col=[4,22.0,1.4142135623730951,21,24]
pf=pf.withColumn('Age',col)
2) `pf[2][0]=1.4142135623730951`
``` `pf[pf.Age==1.414213562373095]=1.4142135623730951`
暂无答案!
目前还没有任何答案,快来回答吧!