我想使用pdfminer来提取文本信息,我已经下载了pdfminer-20131113,我已经在C:\python34
中安装了python,现在使用cmd,我正在设置pdfminer的setup.py
文件的路径,并运行以下命令。
python setup.py install
但我得到下面的错误。
> D:\pdfminer-20101226>python setup.py install
Traceback (most recent call last):
File "setup.py", line 3, in <module>
from pdfminer import __version__
File "D:\pdfminer-20101226\pdfminer\__init__.py", line 4
if __name__ == '__main__': print __version__
^
SyntaxError: invalid syntax
这似乎是pdfminer的www.example.com文件中的一些错误setup.py,我不知道如何解决。
另外,我pdf2txt.py在pdfminer的build文件夹中看到了一个www.example.com文件。我试图将其用作pdf2txt.py -o output.html pdffilename.pdf
(带完整路径)。但没有转换它。它打开了pdf2txt.py
文件。
3条答案
按热度按时间5cnsuln71#
PDFMiner project homepage声明:
完全用Python编写。(适用于版本2.4或更新版本)
再往下:
安装Python 2.4或更新版本。(不支持Python 3。)
因此必须安装Python 2才能运行这个项目。
或者,您可以尝试Python 3 port,
pdfminer3k
;它已经20个月没有更新了,而PDFMiner确实有更新的版本,所以您的里程可能会有所不同。hmae6n7t2#
这应该可以解决Python 3中的问题
qgzx9mmu3#
pdfminer.six是一个支持Python 2+3的fork,使用6.上次提交是在15天前。