ubuntu 如何在Linux上将PDF转换为DOCX

yfwxisqw  于 2023-03-01  发布在  Linux
关注(0)|答案(2)|浏览(447)

我尝试将PDF文件转换为Word,Excel和PowerPoint。我已经尝试了很多命令,如:

soffice -env:UserInstallation=file:///$HOME/.libreoffice-headless/ --convert-to docx:"Microsoft Word 2007/2010/2013 XML" file.pdf
/usr/bin/soffice --headless --invisible --convert-to docx file.pdf
soffice --infilter="writer_pdf_import" --convert-to doc file.pdf

/usr/bin/libreoffice --headless --invisible --convert-to doc file.pdf
/usr/bin/soffice --headless --convert-to docx:"Microsoft Word 2007/2010/2013 XML" file.pdf

abiword --to=doc file.pdf
unoconv -f doc file.pdf
lowriter --invisible --convert-to doc 'file.pdf'

从soffice/libreoffice/unoconv总是收到此错误消息:

:1: parser error : Document is empty
%PDF-1.7

这个是abiword

Unable to init server: Could not connect: Connection refused

** (abiword:6477): WARNING **: clutter failed 0, get a life.
Unable to init server: Could not connect: Connection refused

除了abiword之外的每一个命令。我得到了一个里面有坏字符的doc文件。但是从来没有得到一个正确的文件。
我试图创建一个文件转换器,所以我只想命令行方法。不想使用API的人。
谢谢

vyswwuz2

vyswwuz21#

设法用soffice做到了。我不得不安装这个包:不要忘记使用--infilter=“writer_pdf_import”

dgjrabp2

dgjrabp22#

Linux有一些应用程序可以将pdf导入为图像:LibreOffice,奥克拉尔,口径。
但是如果你想编辑文本,那么你需要安装pdf工具包pdftk,然后运行转换实用程序pdf2txt

pdf2txt input.pdf output.txt

然后,将txt文件导入wordpro,并完成最后的编辑/格式化。

相关问题