数据正以拼图格式写入按日期分区的ADLS Gen2位置
deltaDFFinal.write .mode(SaveMode.Append) .format("parquet") .partitionBy("Date") .save(ADLSGen2Path)
数据将写入具有如下分区名称的文件夹中日期=2022-02-09日期=2022-02-10。。我想删除超过7天的分区,并希望保留追加作为逻辑,因为数据量大,而不是覆盖
bpzcxfmw1#
在保持append写入模式的同时删除过期分区可能无法直接实现。这是一个与数据生命周期相关的问题,建议的做法是定期执行清理作业,如alter table ... drop partition ...
append
alter table ... drop partition ...
46qrfjad2#
Spk.sql(“从delta.<delta path> WHERE DATE<上一个日期删除”)
<delta path>
2条答案
按热度按时间bpzcxfmw1#
在保持
append
写入模式的同时删除过期分区可能无法直接实现。这是一个与数据生命周期相关的问题,建议的做法是定期执行清理作业,如alter table ... drop partition ...
46qrfjad2#
Spk.sql(“从delta.
<delta path>
WHERE DATE<上一个日期删除”)