from zstd import dumps, loads
from json import loads as jloads, dumps as jdumps
def dump(data, file, level=9):
data = jdumps(data).encode()
with open(file, 'wb') as f:
f.write(dumps(data, level))
def load(file):
with open(file, 'rb') as f:
return jloads(loads(f.read()))
1条答案
按热度按时间hc8w905p1#
很久以前我就得到了答案,但忘记了这个问题。
如果有人想做同样的事情,我会这么做:
感谢JonSG,我使用了一段时间的Parquet文件,然后我深入了解了它的工作原理。在此基础上,我创建了自己的代码,使用
zstd
,这是一种文本压缩算法,它确实保存了大量的存储空间。测试用例: