この記事はなにか
RPAツールのUiPathとGoogleVisionAPIと連携させ、
OCR機能を使って画像に書かれた文字を読み取り、テキストに書き込むまでのやり方を記載しています。
結果はこちら!
手順&イメージ
大まかな流れは以下のとおりです。
- Google Cloud PlatformでGoogleVisionAPIのAPIキーを取得
- UiPath.GoogleVision.Activitiesをインストール
- GoogleVisionスコープにAPIキーを設定&その他設定
- 実行!
1.Google Cloud PlatformでGoogleVisionAPIのAPIキーを取得
Google Cloud Platformにログイン後、APIとサービス⇒ライブラリを選択します。

次に開く画面でvisionと打つとCloud Vision APIが出てくるのでそれをクリックします。

2.UiPath.GoogleVision.Activitiesをインストール
UiPathに移動し、UiPath.GoogleVision.Activitiesをインストールします。

3.GoogleVisionスコープにAPIキーを設定&その他設定
各アクティビティをそれぞれ下の画像の様に設定します。
画像のパスは、解析したい画像の保存先を指定して下さい。
ちなみに、URLからだとうまく行かなかったので今回は画像のパスを選択しました。

テキストをファイルに書き込みは以下のように設定しました。
ファイル保存先(ファイル名含む)は任意のパスで良いかと思います。

4.実行!
さあ、実行します
!結果はどうでしょうか…
結果
ローソンさんが報道機関向けに提供した増税の際のレシートを使用して読み取ってみます。
右と左を分けてしまっていますが、だいたい読み取れている感じですね。
通常の文章であれば全然大丈夫そうです。
ちなみに、Google KeepにもOCR機能があるのでやってみました。
ん?Google Keepのほうが精度高くみえるぞ笑
おそらく日本語にしてなかったりしてたので設定の問題でしょうか。
所感
初めてやってみたのですが、思ったより簡単でした。
画像の簡単な文章のテキスト化や、うまくやれば伝票関係の処理とか自動化できそうですね。






