有没有办法加快spark Dataframe 到panda Dataframe 的转换?

t9aqgxwy  于 2023-01-09  发布在  Apache
关注(0)|答案(1)|浏览(165)

我试着用pyspark把spark的数据框转换成databricks笔记本里的Pandas。它需要永远的运行。有没有更好的方法来做这个?有60多万行。
第一个月
df_PD = sparkDF.toPandas()

r1zk6ea1

r1zk6ea11#

您可以尝试更改import语句并导入Pandas API for Spark吗?

import pyspark.pandas as pd
df_PD = sparkDF.to_pandas()

相关问题