我试图筛选一个压缩在. zst中的大型数据库。我知道我可以简单地将其重新加载,然后处理生成的文件,但这会占用我的SSD上的大量空间,并需要2个多小时,所以我想避免,如果可能的话。
通常,当我处理大文件时,我会使用以下代码逐行处理它,
with open(filename) as f:
for line in f.readlines():
do_something(line)
我知道gzip有这个
with gzip.open(filename,'rt') as f:
for line in f:
do_something(line)
但它似乎不与.zsf工作,所以我想知道是否有任何库可以以类似的方式对解压缩后的数据进行压缩和流式传输。举例来说:
with zstlib.open(filename) as f:
for line in f.zstreadlines():
do_something(line)
1条答案
按热度按时间h6my8fg21#