Edited at

PDF中の画像ファイルのみを抽出する

More than 1 year has passed since last update.

Google先生に「PDF 画像 抽出」と聞いてみると一杯出てきますが、出てくる方法全部めんどくさいことしてる&間違ってる事が多い気がします。

でも割とよく聞かれるので、聞かれた時に私がいつも言っている方法を書いておきます。


使用ソフトウェア



  • LibreOffice(v3.6で動作確認してますが、以前でも以降でも動くと思います)

のみです!

ちなみに、MicrosoftのOfficeみたいにお金はらって使いづらいUI使うぐらいなら、みなさんLibreOffice使いましょう(宣伝)


方法


  1. 対象のPDF(e.g. example.pdf)をLibreOfficeで開きます(自動的にDrawで開かれるはず)

  2. 各画像とかが見えるのを確認します

  3. そのままOpenDocument形式(e.g. example.odg)で保存します。

  4. 拡張子を.zipに変えます(e.g. example.odg -> example.zip)

  5. 解凍します

  6. Picturesフォルダの中に全部入っています


おわりに

LibreOfficeはPDFを割と強力に開いてくれるので、変なのじゃない限り大抵のファイルならこれでいけるはずです。

あとは、OpenDocumentが実は書くファイルをzipにまとめたものだとかを知っている人はあまり多くないらしい(!)ので、周りの人に教えてあげると色々捗るんじゃないでしょうか。


追記

2016/12/12にver 5.1.4.2でもこの手法は使えることを確認しています。