我们尝试在scala中读取XLSB文件,但它不起作用。我们尝试使用
spark.read.excel.load("/path/file.xlsb")
它适用于xlsx文件,但不适用于xlsb文件。你有解决办法吗是否有任何功能/命令…将xlsb文件转换为xlsx谢谢你
kqhtkvqz1#
试试Apache Tika,它处理xlsb。Example of Tika from scala展示了如何使用Tika 1.x通过Scala调用Tika。对于Tika 2.x,导入以下两个依赖项,您应该可以使用AutoDetectParser。
<dependency> <groupId>org.apache.tika</groupId> <artifactId>tika-core</artifactId> <version>2.8.0</version> </dependency> <dependency> <groupId>org.apache.tika</groupId> <artifactId>tika-parsers-standard-package</artifactId> <version>2.8.0</version> </dependency>
1条答案
按热度按时间kqhtkvqz1#
试试Apache Tika,它处理xlsb。Example of Tika from scala展示了如何使用Tika 1.x通过Scala调用Tika。
对于Tika 2.x,导入以下两个依赖项,您应该可以使用AutoDetectParser。