我有一个spark df,需要得到基本的描述性统计数据,如本例所示:我的spark版本是3.0.1我运行了以下代码:
df.describe().show()
但它只输出数据,没有任何统计摘要。
cigdeys31#
如果您的Dataframe是空的(我也在使用spark3.0.1),就会发生这种情况。请尝试以下工作示例:
from pyspark.sql.functions import rand, randn df = sqlContext.range(0, 10).withColumn('uniform', rand(seed=10)).withColumn('normal', randn(seed=27)) df.describe().show()
现在尝试使用空Dataframe:
df = spark.createDataFrame(([],)) df.describe().show()
1条答案
按热度按时间cigdeys31#
如果您的Dataframe是空的(我也在使用spark3.0.1),就会发生这种情况。
请尝试以下工作示例:
现在尝试使用空Dataframe: