在scala中读取XLSB格式的文件

fnvucqvd  于 2023-05-29  发布在  Scala
关注(0)|答案(1)|浏览(96)

我们尝试在scala中读取XLSB文件,但它不起作用。
我们尝试使用

spark.read.excel.load("/path/file.xlsb")

它适用于xlsx文件,但不适用于xlsb文件。你有解决办法吗是否有任何功能/命令…将xlsb文件转换为xlsx
谢谢你

kqhtkvqz

kqhtkvqz1#

试试Apache Tika,它处理xlsb。Example of Tika from scala展示了如何使用Tika 1.x通过Scala调用Tika。
对于Tika 2.x,导入以下两个依赖项,您应该可以使用AutoDetectParser。

<dependency>
  <groupId>org.apache.tika</groupId>
  <artifactId>tika-core</artifactId>
  <version>2.8.0</version>
</dependency>
<dependency>
  <groupId>org.apache.tika</groupId>
  <artifactId>tika-parsers-standard-package</artifactId>
  <version>2.8.0</version>
</dependency>

相关问题