我想读取pdf文件的元数据,所以我使用pyPdf包,但对于一些文件,我面临的错误(即;PdfFileReader流/文件对象未处于二进制模式,可能无法正确读取)
brccelvz1#
您需要以二进制模式读取文件:
from pyPdf import PdfFileReader with open('document.pdf', 'rb') as f: pdf = PdfFileReader(f)
1条答案
按热度按时间brccelvz1#
您需要以二进制模式读取文件: