RPAで作業を自動化する際に、候補業務に挙がる約半数は紙のペーパーレス化にかかわってくるともいわれています。したがってRPAとペーパーレスは密接に関係するのですが、紙をペーパーレス化する際に使うのが**「OCR」です。最近のOCR製品は「AI-OCR」**ともいわれており、ここ5~6年で大きく技術が進展した「ディープラーニング」や「機械学習」の技術を使って精度を高めています。
主なAI-OCR製品
日本語で使える主なAI-OCR製品は以下の通りです。
- ABBYY
- Tesseract OCR (OSS)
- Amazon Computer Vision API (AWS)
- Google Cloud Vision API (Google Cloud)
- Microsoft Computer Vision API (Microsoft Azure)
- DX Suite (AI Inside)
- Tegaki (Cogent Labs)
- Flax Scanner (cinnamon)
- CLOBA OCR (Line Brain)
ABBYYは一番の老舗、Tesseract OCRはオープンソースでRPA製品へのバンドル数は最多という特徴があります。3大クラウドベンダーもそれぞれOCRエンジンを提供しています。日本独自では日本語手書きの精度や主要な帳票レイアウトに対応した製品が提供されています。
IQ BotとAI-OCRの違い
IQ Botは、Automation Anywhere社のサイトでは以下のように定義されています。
IQ Bot は、ビジネス ユーザーが簡単にセットアップして使用できる、数多くの複雑なドキュメントを自動的に読み取って処理し、作業の迅速化を図る唯一のネイティブ AI ソリューションです。
うーん、わかったような、わからないような...!?
説明としては以下のようになっています。
コンピューター ビジョン、自然言語処理 (NLP)、ファジー論理、機械学習 (ML) などの AI テクノロジーと RPA のパワーを組み合わせた IQ Bot は、ビジネス ドキュメントや E メールの情報を自動的に分類、抽出、検証します。
非構造化データを手作業で探して整理してからでなければ始められないビジネスプロセスが多数あります。IQ Bot はその 80% を完全に自動化できるよう開発されています。
また、製品カテゴリとしてはAI-OCRではなく「インテリジェント・ドキュメント・プロセッシング (IDP)」となっています。ただ、同じカテゴリの製品を見るとKofax、ABBYY、WorkFusion、AntWorks、OpenText1などが入っており、RPAとAI-OCRが混ざったような製品群となっているので、境界線はあいまいです。
IQ Botと、世間で言われているAI-OCRの一番大きな違いは「OCRエンジン自体は提供せず、読み取り対象にあったOCRエンジンを使って、レイアウトや構造をAIで解析してビジネスユーザーが自分で読み取り精度を上げるフレームワーク」であることです。
文章だとちょっとわかりずらいので、一般のAI-OCRとIQ Botの違いを、図にしてみましょう。
このように、IQ BotはRPAの中にシームレスに統合されつつ、他のAI-OCRエンジンをうまく使って、さらにAIの力で読み取り精度を向上させます。想定としては大量の紙データがあり、ちょっとずつレイアウトが違うものがあるものを大量に処理する際に効率がよくなります。IQ BotはABBYY、Tesseract OCR、Google Computer Vision API、Microsoft Computer Vision APIといったOCRエンジンが使えます。将来的にはTegakiも使えるようになる予定です。
IQ Botが得意な分野
以下のような場合は、一般のAI-OCR製品を使うよりもIQ Botが向いているといわれています。
- 業務自動化のために、紙に記載内容を単にPDFにするだけではなく、内容自体をテキストで抜き出しデータ化したい。
- データ化したい帳票の種類が多い場合。
- 帳票から取得したい項目が多い。
- 帳票の中の明細の数が可変になっている場合にフレキシブルに対応したい。
- 誤りチェックロジックを読取ロジックにカスタマイズして入れてしまいたい。
関連情報
- Automation Anywhere IQ Bot - Automation Anywhere製品ページ
- IQ Bot - 製品ドキュメント
- IQ Botとは - オートメーション道場
- IQ Bot関連記事 - オートメーション道場
- IQ Botって何それおいしいの -紙業務を自動化するためのRPAツール- by @IQ_Bocchi さん
- IQ Bot:OCR選定のコツ by @IQ_Bocchi さん
- 【RPA】AI-OCR適用業務選定をする際の注意点 - 精度100%の壁 by @spaces さん
- OCRエンジンのTesseract(テッセラクト)を用いて画像ファイル内のテキストを抽出してみた by @nori555 さん
- Google Cloud Vision API 機能検証(OCR/TEXT_DETECTION) by @ArataKinjo さん
- AI OCRとは|活用事例・製品比較・導入ポイントを紹介 - ledge.ai