从一个包含动画信息的 Dataframe 中,我想看看每个流派的平均得分,但出现了这个错误,我不明白。problem我期待一个 Dataframe 与平均得分(使用.avg)的每一个流派:浪漫-9.1恐怖-7.8幻想-7.1
qv7cva1a1#
在调用.orderBy()之前,必须以某种方式聚合分组数据。.groupBy()返回GroupedData对象。这应该行得通:
.orderBy()
.groupBy()
from pyspark.sql.functions import col origin_table \ .groupBy('Genres') \ .avg(col('Score').alias('Score')) \ .orderBy('Score')
1条答案
按热度按时间qv7cva1a1#
在调用
.orderBy()
之前,必须以某种方式聚合分组数据。.groupBy()
返回GroupedData对象。这应该行得通: