この記事はなにか
RPAツールのUiPath
とGoogleVisionAPI
と連携させ、
OCR機能
を使って画像に書かれた文字を読み取り、テキストに書き込むまでのやり方を記載しています。
結果はこちら!
手順&イメージ
大まかな流れは以下のとおりです。
- Google Cloud PlatformでGoogleVisionAPIのAPIキーを取得
- UiPath.GoogleVision.Activitiesをインストール
- GoogleVisionスコープにAPIキーを設定&その他設定
- 実行!
1.Google Cloud PlatformでGoogleVisionAPIのAPIキーを取得
Google Cloud Platformにログイン後、APIとサービス
⇒ライブラリ
を選択します。
次に開く画面でvision
と打つとCloud Vision API
が出てくるのでそれをクリックします。
2.UiPath.GoogleVision.Activitiesをインストール
UiPathに移動し、UiPath.GoogleVision.Activities
をインストールします。
3.GoogleVisionスコープにAPIキーを設定&その他設定
各アクティビティをそれぞれ下の画像の様に設定します。
画像のパスは、解析したい画像の保存先を指定して下さい。
ちなみに、URLからだとうまく行かなかったので今回は画像のパス
を選択しました。
テキストをファイルに書き込みは以下のように設定しました。
ファイル保存先(ファイル名含む)は任意のパスで良いかと思います。
4.実行!
さあ、実行します !結果はどうでしょうか…
結果
ローソンさんが報道機関向けに提供した増税の際のレシートを使用して読み取ってみます。
右と左を分けてしまっていますが、だいたい読み取れている感じですね。
通常の文章であれば全然大丈夫そうです。
ちなみに、Google KeepにもOCR機能があるのでやってみました。
ん?Google Keepのほうが精度高くみえるぞ笑
おそらく日本語にしてなかったりしてたので設定の問題でしょうか。
所感
初めてやってみたのですが、思ったより簡単でした。
画像の簡単な文章のテキスト化や、うまくやれば伝票関係の処理とか自動化できそうですね。