unstructured 无法解析xlsx文件的bug

iovurdzv  于 5个月前  发布在  其他
关注(0)|答案(1)|浏览(73)

描述bug

使用unstructured库(通过Langchain)直接读取一个Excel文件(.xlsx)。在分区步骤中失败。

重现方法

from unstructured.partition.xlsx import partition_xlsx
partition_xlsx("./new1.xlsx")

预期行为

预期文件会被分区。

截图

这是文件内容。它是一个简单的xlsx文件。

环境信息

我正在使用unstructured-0.11.6,这是来自langchain的传递依赖关系。

附加上下文

错误跟踪:

相关问题