スキャナで紙資料をPDFにしたもので、特定のページを画像ファイルにして抽出することができます
PDFから画像を抽出するには
ImageMagickのconvertコマンドを使います
コマンド
$ convert -density %解像度% %PDFファイル%[%ページ%] %画像ファイル%
- 解像度の指定は"横x縦"で指定します (200dpiであれば 200x200 で指定します)
- ページ番号は0から始まります。PDFにあるページより大きい値を指定するとエラーになります
- ページ番号を省略した場合は全てのページが変換され、変換後のファイル名に連番が振られます
- 画像ファイルには拡張子を付けることで、任意の形式で出力することができます (.jpg .pngなど)
実行例
PDFの2ページ目(0から始まるので1は2ページ目になる)をPNG画像に出力
$ convert -density "200x200" "2016年02月04日21時02分23秒.pdf[1]" "page001.png"
PDFの全てのページをJPG画像に出力
$ convert -density "200x200" 2016年03月12日08時00分51秒.pdf page.jpg
- page-0.jpg, page-1.jpg, page-2.jpg ,... という形でファイル名に連番が付けられていきます
- 変換にはメモリを大量に使用する場合がありますので、ページ数が多すぎると変換に失敗することがあります。その時はページ数を指定して小分けに変換してください
複数の画像をPDFにするには
逆に、抽出した複数の画像をPDFにすることもできます
コマンド
$ convert %1ページ目の画像% %2ページ目の画像% ... %PDFファイル名%
実行例
$ convert page000.jpg page001.jpg document.pdf
スキャンし終えてPDFに後でページを追加したり、余分なページを省きたい時に使えると思います