当我在这里打开.xls格式的excel文件时,它的打开速度比在这里使用pandas的.xlsx扩展名要快。我使用的是pandas 1.0.1和python 3.7.6。这些文件实际上是一样的,为了方便起见,我只是重命名了文件名和第一个表名。这些文件由6页组成,每页有49列和大约1700行数字数据。正如你所看到的,我只是在这里读第一页,但同样的结果适用于任何数量的表和行(几乎是4倍的时差)
这就是原因吗[从https://windowsfileviewer.com]
xls文件使用专有的二进制格式,而xlsx文件使用一种新的文件格式,称为openxml。xls扩展用于microsoft excel 2003及更早版本,xlsx扩展用于microsoft excel 2007及更高版本。”
我找不到Pandas官方文件的任何信息。我只是想知道为什么会这样,怎么会这样。
1条答案
按热度按时间oug3syen1#
可能是因为xls文件使用专有的二进制格式,而xlsx使用一种新的文件格式,称为openxml