我将连接两个Dataframe并使用 withColumn
方法中,我需要第一个Dataframe中的所有列和我使用 withcolumn
方法我想从第二个Dataframe中删除所有列是否有任何方法可以从第二个Dataframe中删除所有列当前我对每一列都使用单独的删除方法。
val df3 = df1.join(df2, df1("id") === df2("id"))
.drop(df2("name"))
.drop(df2("lastname"))
是否有任何方法可以使用单个方法删除所有列,而不是单独删除。
3条答案
按热度按时间uqcuzwp81#
问题是
drop
只接受一个类型的值Column
&类型的多值String
.如果传递多个类型的值
String
两个加入dfs中可能有相同的列,您可能会丢失与该列相关的数据。而不是删除列,只选择如下所示的必需列。
或
f3temu5u2#
当您有多个列要
drop
通过使用.select
```val df3 = df1.join(df2, df1("id") === df2("id"))
.select("Select all the columns you need")
z4bn682m3#
它可以做如下,请找到代码测试的内联注解