sparksession.catalog.clearcache()可以从hdfs中删除数据吗?

cotxawn7  于 2021-05-27  发布在  Spark
关注(0)|答案(1)|浏览(490)

我遇到了一些数据删除问题,因为我们已经从cdh迁移到hdp(spark 2.2到2.3)。这些表是从hdfs位置读取的,在运行读取和处理这些表的spark作业一段时间后,它抛出table not found异常,当我们检查该位置时,所有记录都消失了。在我的spark(java)代码中,在读取该表之前,调用了clearcache()。它能删除那些文件吗?如果是,如何修复?

r9f1avp5

r9f1avp51#

我认为,您应该看看源代码—spark有自己的缓存用户数据的实现,并且在通过cachemanager管理此缓存时从不删除相同的数据。再见

相关问题