Pyspark：选择除特定列之外的所有列

5m1hhzi4 于 12个月前发布在 Spark

关注(0)|答案(4)|浏览(110)

我在PySpark框架中有大量的列，比如200个。我想选择所有的列，除了说3-4列。如何选择这些列，而不必手动键入要选择的所有列的名称？

来源：https://stackoverflow.com/questions/50838199/pyspark-select-all-columns-except-particular-columns

4条答案

按热度按时间

最后，我决定采取以下措施：

跌落：

df.drop('column_1', 'column_2', 'column_3')

选择：

df.select([c for c in df.columns if c not in {'column_1', 'column_2', 'column_3'}])

赞(0）回复(0）举报 12个月前

这可能会有帮助

df_cols = list(set(df.columns) - {'<col1>','<col2>',....})

df.select(df_cols).show()

赞(0）回复(0）举报 12个月前

df.drop(*[cols for cols in [list of columns to drop]])

如果要删除列的列表很大，则很有用。或者该列表是否可以编程方式导出。

赞(0）回复(0）举报 12个月前

PySpark SQL：SELECT * except（col6，col7，col8）

赞(0）回复(0）举报 12个月前

相关问题

热门标签

Java query python Node 开发语言 request Util 数据库 Table 后端算法 Logger Message Element Parser

最新问答

xxl-job 安全组扫描到执行器端口服务存在信息泄露漏洞
回答(1) 发布于 22天前
xxl-job 不能和nacos兼容？
回答(3) 发布于 22天前
xxl-job 任务执行完后无法结束，日志一直转圈
回答(3) 发布于 22天前
xxl-job-admin页面上查看调度日志样式问题
回答(1) 发布于 22天前
xxl-job 参数512字符限制能否去掉
回答(1) 发布于 22天前