我试着用pyspark把spark的数据框转换成databricks笔记本里的Pandas。它需要永远的运行。有没有更好的方法来做这个?有60多万行。第一个月df_PD = sparkDF.toPandas()
df_PD = sparkDF.toPandas()
r1zk6ea11#
您可以尝试更改import语句并导入Pandas API for Spark吗?
import pyspark.pandas as pd df_PD = sparkDF.to_pandas()
1条答案
按热度按时间r1zk6ea11#
您可以尝试更改import语句并导入Pandas API for Spark吗?