使用pyspark读取目录中的excel文件

kmb7vmvb  于 2023-01-12  发布在  Spark
关注(0)|答案(1)|浏览(131)

'嗨,我正在尝试使用pyspark读取目录中的excel文件,但出现fielnotfound错误
'环境路径='数据库文件系统:/mnt'
原始=“设备/原始/工作1”
路径=环境路径+原始
文件路径=路径+'/'
对象=dbutils.fs.ls(文件路径)
对于对象中的文件名:

`if file_name.isFile():

   sample_df=spark.read.format("com.crealytics.spark.excel").option("header", "false").load(objects+file_name) `

我正在尝试此代码来读取我的Excel文件,但找不到文件错误。有人能帮我吗?

igetnqfo

igetnqfo1#

我认为在加载中你没有传递正确的路径,所以你得到了错误文件未找到的错误。
试试这个你会得到输出。

objects = dbutils.fs.ls(path)
for file_name in objects:
  if file_name.isFile():
    if file_name[0].endswith("xlsx"): #optional
      sample_df=spark.read.format("com.crealytics.spark.excel").option("header", "true").load(file_name[0])

相关问题