我不明白为什么在最后一个阶段没有任何save或append数据操作

093gszye 于 2021-05-27 发布在 Spark

关注(0)|答案(1)|浏览(486)

df.writeStream
      .foreachBatch((batchDF: DataFrame, batchId: Long) =>
        batchDF.write
          .format("org.apache.spark.sql.cassandra")
          .cassandraFormat(cassandraTable, cassandraKeyspace, cassandraCluster)
          .mode("append")
          .save())
      .option("checkpointLocation", checkpointDir)
      .start()
      .awaitTermination()

在代码的最后，dataframe被写入cassandra表。
通过ui检查最后一个阶段后，没有执行save/append data的部分。

我想知道为什么它不存在或者是我错过了什么。
================================更改我的代码后===========================

.writeStream
//      .foreachBatch((batchDF: DataFrame, batchId: Long) =>
//        batchDF.write
//          .format("org.apache.spark.sql.cassandra")
//          .cassandraFormat(cassandraTable, cassandraKeyspace, cassandraCluster)
//          .mode("append")
//          .save())
      .cassandraFormat(cassandraTable, cassandraKeyspace, cassandraCluster)
      .option("checkpointLocation", checkpointDir)
      .start()
      .awaitTermination()

但我可以在sql选项卡中看到writetodatasourcev2。

cassandra apache-spark apache-spark-sql spark-structured-streaming spark-cassandra-connector

来源：https://stackoverflow.com/questions/63509610/i-dont-understand-why-there-isnt-any-save-or-append-data-operation-at-the-last

1条答案

按热度按时间

nszi6y051#

也许它没有直接回答你的问题，但是对于spark 3.0和scc 3.0.0（你应该使用3.0.0-beta），你不应该使用foreachbatch，但只需通过指定cassandra格式按原样写入数据—因为scc 2.5.0 spark structured streaming本机支持—请参阅公告：https://www.datastax.com/blog/2020/05/advanced-apache-cassandra-analytics-now-open-all

赞(0）回复(0）举报 2021-05-27

我来回答

我不明白为什么在最后一个阶段没有任何save或append数据操作

1条答案

相关问题

热门标签

最新问答