你好,我正在尝试读取 parquet 文件已压缩并保存为sample.parquet.gz文件在Spark,如果有人能告诉我如何做到这一点?PS-我知道我可以很容易地阅读gz.parquet文件在Spark,但我想读一个parquet这是压缩使用gzip
elcex8rz1#
df =Spark.读取.Parquet(“/mnt/数据湖/xxxxxx/Xxxxxx/打包文件/zip文件名. gz”)
我喜欢这个。试试这个?
1条答案
按热度按时间elcex8rz1#
df =Spark.读取.Parquet(“/mnt/数据湖/xxxxxx/Xxxxxx/打包文件/zip文件名. gz”)
我喜欢这个。试试这个?