LoginSignup
1
2

More than 1 year has passed since last update.

AutomatorとTesseractを使って画像から検索可能なPDFを作る

Posted at

この記事はmacOS Monterey 12.2時点で書かれています。

この前は画像にSpotlightコメントを付加したんですけど、

でもSpotlight検索可能にするだけなら、Tesseractの機能で透明なテキスト入りのPDFに変換することはできるんですよ。そっちにしよっか

Automator

今回はアプリケーション形式で作ってみましたが、フォルダアクションでも動きます。
image.png

のシェルスクリプト部分

export PATH=$PATH:/opt/homebrew/bin:/opt/homebrew/sbin
for f in "$@"
do
    tesseract "$f" "$f" -l jpn+eng pdf
done

どうなるか

画像ファイルをドロップすると(今度は複数でもいい)、元の画像と同じフォルダにPDFがどんどん出来ていきます。全部終わると画像ファイルはゴミ箱に移動されます。ゴミ箱したくなかったらシェルスクリプト以降は不要です。これAutomatorの意味あったかな…まあフォルダアクションにもできるし…

余談

スキャナから画像をフォルダアクションに渡していた時に気づいたのですが、作成日が未来のファイルはフォルダに入れてもフォルダアクションが作動しません。アプリケーション形式のAutomatorワークフローは問題なく作動します。スキャナが古くて内蔵時計が狂っていたらしい…

1
2
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
2