重命名 Dataframe pyspark中的列添加字符串

vmdwslir  于 2023-01-12  发布在  Spark
关注(0)|答案(3)|浏览(134)

我用Pandas编写了Python代码,在列名的开头添加了“VEN_”:

Tablon.columns = "VEN_" + Tablon.columns

它运行得很好,但是现在我用PySpark,它不工作了。我试过:

Vaa_total.columns = ['Vaa_' + col for col in Vaa_total.columns]

for elemento in Vaa_total.columns:
    elemento = "Vaa_" + elemento

以及其他类似的东西,但它不工作。
我不想替换列名,我只想保留它,但要在开头添加一个字符串。

lokaqttq

lokaqttq1#

试试这样的方法:

for elemento in Vaa_total.columns:
    Vaa_total =Vaa_total.withColumnRenamed(elemento, "Vaa_" + elemento)
wmtdaxz3

wmtdaxz32#

我在评论中链接了类似的主题。下面是根据你的任务改编的例子:

dataframe.select([col(col_name).alias('VAA_' + col_name) for col_name in dataframe])
qacovj5a

qacovj5a3#

标准书写格式:

renamed_df = df.withColumnRenamed(col_name, "insert_text" + col_name) for col_name in dataframe.columns])

相关问题