WorkFusion RPA ExpressでOCRを自動化してみた

Last updated at 2018-12-07Posted at 2018-12-06

はじめに

エンジニア？アナリスト？サイエンティスト？歴5ヶ月めの新卒社員が最近学んだことをちょっとずつまとめてみたもの。11回目！！前回、前々回と統計学関係だったりデータを取り扱う関係の記事を連続させて書いてきたので、ちょっと今日は趣向を凝らしてRPAを実際に触ってみた体験記にしてみようと思います^^

これまでに書いた記事の最新3回分はこちら↓
第8弾
 第9弾
 第10弾

OCR・・・Optical Character Recognition(Reader)／光学的文字認識のことをさす。簡単にいうと活字のイメージデータを文字認識して、テキストデータに変換する機能。

OCRで処理した結果がそのときの設定によって影響を受けやすい（読み取りの解像度、画像として認識するもとの原稿の状態など）ため、それに合わせた調整をする必要がある
領域分割を自動でするものを使用する場合、縦書きと横書きが混在すると領域の判別ができなくなってしまう可能性がある
使用するものの認識可能な言語の設定によって読み取り可能な言語が異なるため、事前に使用前に確認が必要

Work Fusion RPA ExpressにおけるOCRの位置づけとしては、PDFや画像、htmlなどの電子ファイルからデータを入手することが可能な機能とのこと。

YouTubeにWorkFusionが公式としてあげている動画をもとに作成。
今回は、WorkFusionが出しているMouse Clickの説明書PDFからActionの種類の名前を文字認識、テキストデータに変換するRobotを作成する。

下で詳細について、記載。

クリックの詳細を設定
- 押すボタンはButton：項目で『Left Button』を選択
- クリック方法はType:項目で『Double Click』を選択
クリックする対象の設定
- 　Targetを『Image』に設定、『Capture New Image』で該当するファイルを画面をキャプチャーして登録
読み取ったものを入れる変数の箱を設定
- 画面上『Recorder Variables』を開く
- データの名前をNameカラムで、データ型をTypeカラムで設定

あらかじめ編集するデータを開いておく
『Capture New Image』で読み取りたい範囲を選択、『Anchor Region』と『Capture Region』を調整して完了したらOKを選択
- Anchor Region・・・ふたつ以上の文書から文字認識、テキストデータへの変換をおこなうにあたって、文書を変えても変わることのない、キャプチャーする範囲を見つけるための目印（参照点）として設定された範囲
- Capture Region・・・実際にキャプチャーされるデータの範囲
- 設定画面はこんな感じ↓
『Put OCR result into Variable』で読み取ったものをどの変数に入れるのか指定

完成したRobotを実行するとこんな感じに。

はじめは設定等に苦戦してしまい作成に時間がかかったが、慣れてしまえば作成そのものにかかる時間はそこまでかからなさそう
同じ形式の相当数の文書で必要な項目のみを抽出してまとめたい場合、ひとつこれを作成してしまえば工数削減につながるのでは
今回は実行する対象のデータをマウスのクリックを命令することで選択していたが、対象ではないデータも同一画面上にある場合、ほかのデータ指定の方法を使用した方がよさそう→WorkFusionが公式でその方法を紹介しているチュートリアル動画あり。
すでに紙媒体でしか残っていないデータを抽出したい場合は、Microsoft Lensの使用で対応可能。OCRをする目的は果たすことができると判断
ただ、WorkFusionの場合は日本語には対応していなさそう（操作画面が日本語に設定不可だったため、その可能性が高い、要確認）だったので、使用するには限界があるのでは

RPAを実際に触るっていうのが初めてだったのでなかなかに苦戦したのがちょっと悔しかったなぁ。PowerAppsを触り始めた頃のことを思い出して、改めて新しいことを触って学んでいくって大変だなぁと思いました^^;

それと何より、慣れないことをやると甘いものを身体が求めてしまう！！！今日はちょっと自分にご褒美をあげようかな、とかいつも通り自分を甘やかす方向へと考えがむかっております。明日はまた統計関係のことを書こうかな。

ではでは！！