有没有一种方法可以使用Python或Node.js检查PDF是否是平面的

qkf9rpyu  于 2023-08-04  发布在  Node.js
关注(0)|答案(1)|浏览(110)

我有一个大的PDF文件集是在不同的设备和应用程序创建的。我只需要知道如果一个PDF是平面/扁平或没有。我更喜欢使用Python或Node.js实现的解决方案,但任何posix CLI工具也会有所帮助。
我会很感激任何建议,即使它的工作大部分时间。

更新

由于在评论中询问了我对平面PDF的定义,我会添加两个定义:
1.定义一:如果PDF只有一层,则它是平面的。
1.定义二:如果PDF没有任何交互元素,则它是平面的。
任何解决定义1或2的问题的解决方案都是好的。

daolsyd0

daolsyd01#

使用PyPDF2库

import PyPDF2

reader = PyPDF2.PdfReader(file)
has_annotations = any(page.annots for page in reader.pages)

if has_annotations:
  print("pdf is not flattened")

else:
  print("pdf is flattened")

字符串

相关问题