我尝试将PDF文件转换为Word,Excel和PowerPoint。我已经尝试了很多命令,如:
soffice -env:UserInstallation=file:///$HOME/.libreoffice-headless/ --convert-to docx:"Microsoft Word 2007/2010/2013 XML" file.pdf
/usr/bin/soffice --headless --invisible --convert-to docx file.pdf
soffice --infilter="writer_pdf_import" --convert-to doc file.pdf
/usr/bin/libreoffice --headless --invisible --convert-to doc file.pdf
/usr/bin/soffice --headless --convert-to docx:"Microsoft Word 2007/2010/2013 XML" file.pdf
abiword --to=doc file.pdf
unoconv -f doc file.pdf
lowriter --invisible --convert-to doc 'file.pdf'
从soffice/libreoffice/unoconv总是收到此错误消息:
:1: parser error : Document is empty
%PDF-1.7
这个是abiword
Unable to init server: Could not connect: Connection refused
** (abiword:6477): WARNING **: clutter failed 0, get a life.
Unable to init server: Could not connect: Connection refused
除了abiword之外的每一个命令。我得到了一个里面有坏字符的doc文件。但是从来没有得到一个正确的文件。
我试图创建一个文件转换器,所以我只想命令行方法。不想使用API的人。
谢谢
2条答案
按热度按时间vyswwuz21#
设法用soffice做到了。我不得不安装这个包:不要忘记使用--infilter=“writer_pdf_import”
dgjrabp22#
Linux有一些应用程序可以将pdf导入为图像:LibreOffice,奥克拉尔,口径。
但是如果你想编辑文本,那么你需要安装pdf工具包
pdftk
,然后运行转换实用程序pdf2txt
。然后,将txt文件导入wordpro,并完成最后的编辑/格式化。