PythonSpark:“GroupedData”对象没有属性“orderBy”

zd287kbt  于 2022-12-17  发布在  Python
关注(0)|答案(1)|浏览(716)

从一个包含动画信息的 Dataframe 中,我想看看每个流派的平均得分,但出现了这个错误,我不明白。
problem
我期待一个 Dataframe 与平均得分(使用.avg)的每一个流派:浪漫-9.1恐怖-7.8幻想-7.1

qv7cva1a

qv7cva1a1#

在调用.orderBy()之前,必须以某种方式聚合分组数据。.groupBy()返回GroupedData对象。
这应该行得通:

from pyspark.sql.functions import col

origin_table \
    .groupBy('Genres') \
    .avg(col('Score').alias('Score')) \
    .orderBy('Score')

相关问题