我只发现pyspark.pandas.DataFrame
可以散射。
参考:https://spark.apache.org/docs/3.2.1/api/python/reference/pyspark.pandas/api/pyspark.pandas.DataFrame.plot.scatter.htmlpyspark.sql.DataFrame
和pyspark.pandas.DataFrame
之间的关系是什么?
我可以将pyspark.sql.DataFrame
转换为pyspark.pandas.DataFrame
吗?
2条答案
按热度按时间zu0ti5jz1#
是的,您可以使用
to_pandas_on_spark
(doc)或pandas_api
(doc)函数轻松地将Spark DataFrame转换为Spark Pandas DataFrame(取决于Spark版本-后者在Spark 3.3+中)。osh3o9ms2#
为了解决你的第二个问题,似乎你只需要
toPandas
?输出: