PyPDF2を調べた
- PDFを連結したしたいと思い調べてみた。
- 検索するとPyPDF2がでてきた。
- 2023.02.15日現在、バージョンが3.0.1になっていた。
- バージョンアップにより、クラス名、関数、メソッド等の名前の変更があった。以下の内容はクラス名などが古い記述となっている。
インストール
- インストールは以下のように行った。
pip install pypdf2
インポート
import PyPDF2
PDFの連結
まずは連結するpdfファイルをリストにする
- 以下ではglobでpdfファイルを検索している
# PDFファイルを検索
# globで検索
import glob
pdffiles=glob.glob('*.pdf')
ファイル連結
merger=PyPDF2.PdfFileMerger()
for f in pdffiles:
merger.append(f)
merger.write('merge.pdf') #連結したファイルを出力
merger.close()
PDFの分割
分割元を読み込み
source_pdf = open('merge.pdf', 'rb')
source = PyPDF2.PdfFileReader(source_pdf, strict=False)
分割元からページを指定して,出力先に追加する。
output = PyPDF2.PdfFileWriter()
output.addPage(source.getPage(0))
output.addPage(source.getPage(1))
ファイル出力
output_pdf = open('output_pdf.pdf', 'wb')
output.write(output_pdf)
output_pdf.close()