pdfminerを使用する際、Encyptされているpdfをそのまま入力するとエラーが出るので、事前にdecryptしておく必要がある。
パスワードが存在する場合は --password=パスワード
とする。
decrypt_pdfs.py
import glob
import os
from subprocess import call
encrypted_files = glob.glob(pdf_directory)
for file in encrypted_files:
pdf_filename = os.path.basename(file)
out = "./decrypted_PDFs/" +pdf_filename
call('qpdf --password=%s --decrypt %s %s' %('', file, out), shell=True)