描述性统计或摘要统计pyspark 3.0.1

rqmkfv5c  于 2021-05-17  发布在  Spark
关注(0)|答案(1)|浏览(534)

我有一个spark df,需要得到基本的描述性统计数据,如本例所示:

我的spark版本是3.0.1我运行了以下代码:

df.describe().show()

但它只输出数据,没有任何统计摘要。

cigdeys3

cigdeys31#

如果您的Dataframe是空的(我也在使用spark3.0.1),就会发生这种情况。
请尝试以下工作示例:

from pyspark.sql.functions import rand, randn

df = sqlContext.range(0, 10).withColumn('uniform', rand(seed=10)).withColumn('normal', randn(seed=27))
df.describe().show()


现在尝试使用空Dataframe:

df = spark.createDataFrame(([],))
df.describe().show()

相关问题