python 在pyspark中阅读. parquet.gz、gzip格式的 parquet 文件

jaxagkaj  于 2023-02-21  发布在  Python
关注(0)|答案(1)|浏览(220)

你好,我正在尝试读取 parquet 文件已压缩并保存为sample.parquet.gz文件在Spark,如果有人能告诉我如何做到这一点?
PS-我知道我可以很容易地阅读gz.parquet文件在Spark,但我想读一个parquet这是压缩使用gzip

elcex8rz

elcex8rz1#

df =Spark.读取.Parquet(“/mnt/数据湖/xxxxxx/Xxxxxx/打包文件/zip文件名. gz”)

我喜欢这个。试试这个?

相关问题