上下文:我有一个使用SQL查询的 Dataframe 。从这个查询中,我使用panda on spark API保存到一个 Dataframe 。现在,经过一些转换,我想将这个新的 Dataframe 保存到给定数据库的一个新表中。
示例:
spark = SparkSession.builder.appName('transformation').getOrCreate()
df_final = spark.sql("SELECT * FROM table")
df_final = ps.DataFrame(df_final)
## Write Frame out as Table
spark_df_final = spark.createDataFrame(df_final)
spark_df_final.write.mode("overwrite").saveAsTable("new_database.new_table")
但这不起作用。我如何将pandas on spark API Dataframe 直接保存到数据库中的新表中(该数据库还不存在)谢谢
1条答案
按热度按时间k10s72fa1#
您可以使用以下过程。我有以下演示表。