azuredatabricks:从azureblob存储中查找databricks delta表使用的文件

ars1skjm  于 2021-07-12  发布在  Spark
关注(0)|答案(0)|浏览(142)

我在databricks的“data”选项卡中看到delta表使用的文件数是20000(size:1.6tb). 但是delta存储文件的azureblob存储上的实际文件数是1350万(大小:31tb)。
进行了以下检查:
真空吸尘器每天运行,默认间隔为7天(每天大约需要4小时)
事务日志是最近30天的
问题:
除了delta表使用的文件之外,还有哪些额外的文件?
我们想删除这些额外的文件并释放存储空间。如何隔离delta表使用的文件?有没有命令列出这个?
注意:我正在使用azuredatabricks,目前正在尝试真空干运行命令,看看它是否有帮助(将很快更新)。
谢谢,这是预付款

暂无答案!

目前还没有任何答案,快来回答吧!

相关问题