pyspark 如何从Databricks上的Datalake中读取所有以.csv结尾的文件

hfwmuf9z  于 2022-11-01  发布在  Spark
关注(0)|答案(1)|浏览(206)

我想将以.csv结尾的文件(在datalake上)读入数据库。文件名没有定义的格式,但所有csv中的底层数据都有相同的架构。
我希望能够一次性阅读所有的csv。
Please see the attached image for more details in the folder structure

bvjxkvbb

bvjxkvbb1#

您正在寻找的只是模式匹配,而读取文件。
您应该这样阅读这些文件:

spark.read.format("csv").load("/mnt/some-mount-point/*.csv")

材质:

相关问题