如何在配置单元中保存spark.writestream结果？

brtdzjyr 于 2021-06-07 发布在 Kafka

关注(0)|答案(1)|浏览(454)

我正在使用 spark.readStream 从Kafka读取数据并对结果Dataframe执行分解。我试图保存在一个配置单元表爆炸的结果，我无法找到任何解决方案。我尝试了下面的方法，但它不起作用（它运行，但我没有看到任何新的分区创建）

val query = tradelines.writeStream.outputMode("append")
  .format("memory")
  .option("truncate", "false")
  .option("checkpointLocation", checkpointLocation)
  .queryName("tl")
  .start() 

sc.sql("set hive.exec.dynamic.partition.mode=nonstrict;")

sc.sql("INSERT INTO TABLE default.tradelines PARTITION (dt) SELECT * FROM tl")

apache-kafka apache-spark spark-structured-streaming spark-hive

来源：https://stackoverflow.com/questions/47893765/how-do-i-save-spark-writestream-results-in-hive