More than 5 years have passed since last update.

UiPathでOCR機能を使ってみる（GoogleVisionAPI使用）

Last updated at 2020-05-19Posted at 2020-03-27

この記事はなにか

RPAツールのUiPathとGoogleVisionAPIと連携させ、
OCR機能を使って画像に書かれた文字を読み取り、テキストに書き込むまでのやり方を記載しています。

結果はこちら！

![image.png](https://qiita-image-store.s3.ap-northeast-1.amazonaws.com/0/224314/ddf3efbe-dad1-0313-9e37-66fc633d57fa.png)

大まかな流れは以下のとおりです。

UiPathのシーケンスのイメージはこんな感じです。

Google Cloud Platformにログイン後、APIとサービス⇒ライブラリを選択します。

次に開く画面でvisionと打つとCloud Vision APIが出てくるのでそれをクリックします。

有効にするをクリックします。

認証情報をクリックします。

認証情報を作成⇒APIキーをクリックします。

APIキーが作成されました！

UiPathに移動し、UiPath.GoogleVision.Activitiesをインストールします。

シーケンスで以下のように組み立てます。

各アクティビティをそれぞれ下の画像の様に設定します。
画像のパスは、解析したい画像の保存先を指定して下さい。
ちなみに、URLからだとうまく行かなかったので今回は画像のパスを選択しました。

テキストをファイルに書き込みは以下のように設定しました。
ファイル保存先（ファイル名含む）は任意のパスで良いかと思います。

さあ、実行します！結果はどうでしょうか…

ローソンさんが報道機関向けに提供した増税の際のレシートを使用して読み取ってみます。

右と左を分けてしまっていますが、だいたい読み取れている感じですね。
通常の文章であれば全然大丈夫そうです。

ちなみに、Google KeepにもOCR機能があるのでやってみました。

ん？Google Keepのほうが精度高くみえるぞ笑
おそらく日本語にしてなかったりしてたので設定の問題でしょうか。

初めてやってみたのですが、思ったより簡単でした。
画像の簡単な文章のテキスト化や、うまくやれば伝票関係の処理とか自動化できそうですね。