使用pyspark的dataframe中的前n列

hfsqlsce  于 2021-07-13  发布在  Spark
关注(0)|答案(1)|浏览(324)

如何选择Dataframe中的前n列并将其转换为另一个Dataframe?
有一个包含180列的df,我想创建另一个包含前105列的df,在脚本中不隐式地提到列名。

jchrr9hc

jchrr9hc1#

您可以从以下位置获取列名列表 df.columns ,然后选择列表中的前105个值:

df2 = df.select(df.columns[:105])

但既然你也用scala标记了它,这里有一个scala解决方案:

val df2 = df.select(df.columns.take(105).map(col): _*)

相关问题