hive 如何在pyspark中重命名 Dataframe 的列?

k10s72fa  于 2022-11-05  发布在  Hive
关注(0)|答案(1)|浏览(147)

以下是部件代码:

df = None

F_DATE = ['202101', '202102', '202103']

for date in F_DATE:
    if df is None:
        df = spark.sql("select count(*) as Total_count from test_" + date)
    else:
        df2 = spark.sql("select count(*) as Total_count from test_" + date)
        df = df.union(df2)

df.write.csv('/csvs/test.csv')

我尝试了“toDF()”、“withColumnRenamed()”和“selectExpr()”,但列名没有更改。

注意。请使用配置单元中的表。
ADD我从未使用“df.show()”编写代码,我使用“df.show()”读取代码。当在编写代码中使用“df.show()”时,确认列名正确,而当在读取代码中使用“df.show()”时,确认列名不正确。

qlzsbp2j

qlzsbp2j1#

您可以用途:

df = df.withColumnRenamed('old_name', 'new_name')

相关问题