我有以下Dataframe:
+-------+ |letters| +-------+ | [b,a]| |[f,c,s]| |[m,d,l]| +-------+
我试着把每一行的字母按字母顺序排序。最终结果应为:
+-------+ |letters| +-------+ | [a,b]| |[c,f,s]| |[d,m,l]| +-------+
envsm3lx1#
如果 letters 是数组列,可以直接排序:
letters
from pyspark.sql.functions import sort_array df2 = df.withColumn("sortedCol", sort_array('letters', False))
ttcibm8c2#
如果有人正在使用microsoft.spark.sql程序集,则可以使用sortarray函数来执行此操作。这是特定于使用.net spark的人的。您可以在此处找到文档:https://docs.microsoft.com/en-us/dotnet/api/microsoft.spark.sql.functions.sortarray?view=spark-dotnet
2条答案
按热度按时间envsm3lx1#
如果
letters
是数组列,可以直接排序:ttcibm8c2#
如果有人正在使用microsoft.spark.sql程序集,则可以使用sortarray函数来执行此操作。
这是特定于使用.net spark的人的。
您可以在此处找到文档:
https://docs.microsoft.com/en-us/dotnet/api/microsoft.spark.sql.functions.sortarray?view=spark-dotnet