[0]はじめに
Zitanです。
今回は複数のPDFファイルに対してOCR処理を行い、内容をExcelファイルに書き込むまでの処理を実装しました。
前回は、「Microsoft OCRエンジン」を使用していましたが、
日本語を抽出する精度は「OmniPage OCR」の方が高いということで実際使ってみたところ、たしかに抽出する精度が高かったです。
[1]結果
まずは、結果の動画をご覧下さい。雰囲気も動画の方が分かりやすいのではないかと。。
[2]作り方
重複する内容もあるので、基本は前回の記事を参考にして下さい。
テストデータ作成マクロ
UiPathでOCR処理(請求書1件分)してみた
今回使った変数の一覧
変数は[Ctrl+K]で作成すると自動的に型を判別してくれますが、修正が必要な場合もあります。
※入る型が一意に決定するアクティビティに対して便利です。
<代入アクティビティの式>
ファイルコレクション=Directory.GetFiles(選択されたフォルダ)
ドキュメントパス=item.ToString
count=count+1
"A" & count+1
必要なパッケージ一覧
「UiPath.IntelligentOCR.Activities」のバージョンは「v4.10.0」です。
※説明は長くなるので、プロセスの中身は動画をご覧下さい。
大きな流れとしては、こんな感じです。
1.OCR処理するファイル一覧が入っているフォルダを選択する(ユーザーが選択)
2.フォルダ内のファイル群をArray型(配列)の変数に格納する
3.For Eachループ処理を行う(ファイル名は、配列を文字列型に型変換して取得します)
4.ファイルに対してOCR処理を行う
5.OCR処理されて抽出されたデータセットをExcelに書き込む
[3]まとめ
いかがでしょうか。
今回は、タクソノミーは請求書だけを読み込んでいますが、
いくつかのドキュメントを自動判別するプロセスについても検討しようと思います。
あとは、手書きとタイピング文字の混在パターンも興味深いですね。