ソリューション
>pip install pdf2image
フォルダ構成とかは、以下のソースコード参照
p2i.py
import os
from pathlib import Path
from pdf2image import convert_from_path
# poppler/binを環境変数PATHに追加する
poppler_dir = Path(__file__).parent.absolute() / "poppler/Library/bin"
os.environ["PATH"] += os.pathsep + str(poppler_dir)
# PDFファイルのパス
pdf_path = Path("./000108041.pdf")
print(pdf_path)
# PDF -> Image に変換(150dpi)
pages = convert_from_path(str(pdf_path), 150)
# 画像ファイルを1ページずつ保存
image_dir = Path("./img_data")
for i, page in enumerate(pages):
# PNGで保存
file_name = pdf_path.stem + "_{:03d}".format(i + 1) + ".png"
image_path = image_dir / file_name
page.save(str(image_path), "PNG")
参考文献
そもそもネットに車輪の再開発されまくっているネタ
Pythonを使ってPDFデータをPNG画像に変換するなんていうネタは山ほどあるわけです。
これをあえて書く必要があるのか?っていう話です。
結論からいうと、個人的には「ある」と思っていて
- 自分の知識の整理になる
- 次回検索したときに、そのサイト(エントリ)があるとは限らない
- 自分なりの好きな(しっくりくる)コードを残して置ける
などの理由で、そういうのを書いておくのは重要だと思っています。
(おわり)