python 将excel工作表读入spark dataframe -包问题

pkwftd7m  于 2023-04-28  发布在  Python
关注(0)|答案(1)|浏览(148)

我一直在尝试使用crealytics spark excel库,但没有成功。
安装程序:在从“com.crealytics:spark-excel_2.12:3.3.1_0.18。7”集群上的Scala版本是www. example www.example.com
尝试使用此库的代码非常简单:

sdf = spark.read.format("com.crealtyics.spark.excel").option("header","true").load(filepath)

但错误消息如下:
阅读dbfs时出错:/mnt/container/folder 1/folder 2/FileName。xlsx中的xlsx。调用o 627时出错。java.lang.ClassNotFoundException:找不到数据源:com.crealtyics.spark.excel.请在https://spark.apache.org/third-party-projects.html查找软件包
软件包按预期安装:x1c 0d1x
这里缺少了一些简单而明显的东西--但它是什么呢?提前感谢您提供的任何帮助。

dbf7pr2w

dbf7pr2w1#

很抱歉浪费了这个问题,但我找到了一个解决方案,并希望与其他面临类似问题的人分享。有很多网站仍然指向以前的代码,这些代码指向Maven Repository。
使用Spark-Excel V2和数据源API V2。0+时,对Maven存储库的引用可以替换为对“excel”的引用。

sdf = spark.read.format("excel").option("header","true").load(filepath)

更多详情:https://index.scala-lang.org/crealytics/spark-excel参见标题下的 * 功能 *

相关问题