8
4

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 3 years have passed since last update.

IQ Botとは? AI-OCRとの違い

Last updated at Posted at 2020-08-01

RPAで作業を自動化する際に、候補業務に挙がる約半数は紙のペーパーレス化にかかわってくるともいわれています。したがってRPAとペーパーレスは密接に関係するのですが、紙をペーパーレス化する際に使うのが**「OCR」です。最近のOCR製品は「AI-OCR」**ともいわれており、ここ5~6年で大きく技術が進展した「ディープラーニング」や「機械学習」の技術を使って精度を高めています。

主なAI-OCR製品

日本語で使える主なAI-OCR製品は以下の通りです。

  • ABBYY
  • Tesseract OCR (OSS)
  • Amazon Computer Vision API (AWS)
  • Google Cloud Vision API (Google Cloud)
  • Microsoft Computer Vision API (Microsoft Azure)
  • DX Suite (AI Inside)
  • Tegaki (Cogent Labs)
  • Flax Scanner (cinnamon)
  • CLOBA OCR (Line Brain)

ABBYYは一番の老舗、Tesseract OCRはオープンソースでRPA製品へのバンドル数は最多という特徴があります。3大クラウドベンダーもそれぞれOCRエンジンを提供しています。日本独自では日本語手書きの精度や主要な帳票レイアウトに対応した製品が提供されています。

IQ BotとAI-OCRの違い

IQ Botは、Automation Anywhere社のサイトでは以下のように定義されています。

IQ Bot は、ビジネス ユーザーが簡単にセットアップして使用できる、数多くの複雑なドキュメントを自動的に読み取って処理し、作業の迅速化を図る唯一のネイティブ AI ソリューションです。

うーん、わかったような、わからないような...!?
説明としては以下のようになっています。

コンピューター ビジョン、自然言語処理 (NLP)、ファジー論理、機械学習 (ML) などの AI テクノロジーと RPA のパワーを組み合わせた IQ Bot は、ビジネス ドキュメントや E メールの情報を自動的に分類、抽出、検証します。
非構造化データを手作業で探して整理してからでなければ始められないビジネスプロセスが多数あります。IQ Bot はその 80% を完全に自動化できるよう開発されています。

また、製品カテゴリとしてはAI-OCRではなく「インテリジェント・ドキュメント・プロセッシング (IDP)」となっています。ただ、同じカテゴリの製品を見るとKofax、ABBYY、WorkFusion、AntWorks、OpenText1などが入っており、RPAとAI-OCRが混ざったような製品群となっているので、境界線はあいまいです。

IQ Botと、世間で言われているAI-OCRの一番大きな違いは「OCRエンジン自体は提供せず、読み取り対象にあったOCRエンジンを使って、レイアウトや構造をAIで解析してビジネスユーザーが自分で読み取り精度を上げるフレームワーク」であることです。

文章だとちょっとわかりずらいので、一般のAI-OCRとIQ Botの違いを、図にしてみましょう。

image.png

このように、IQ BotはRPAの中にシームレスに統合されつつ、他のAI-OCRエンジンをうまく使って、さらにAIの力で読み取り精度を向上させます。想定としては大量の紙データがあり、ちょっとずつレイアウトが違うものがあるものを大量に処理する際に効率がよくなります。IQ BotはABBYY、Tesseract OCR、Google Computer Vision API、Microsoft Computer Vision APIといったOCRエンジンが使えます。将来的にはTegakiも使えるようになる予定です。

IQ Botが得意な分野

以下のような場合は、一般のAI-OCR製品を使うよりもIQ Botが向いているといわれています。

  • 業務自動化のために、紙に記載内容を単にPDFにするだけではなく、内容自体をテキストで抜き出しデータ化したい。
  • データ化したい帳票の種類が多い場合。
  • 帳票から取得したい項目が多い。
  • 帳票の中の明細の数が可変になっている場合にフレキシブルに対応したい。
  • 誤りチェックロジックを読取ロジックにカスタマイズして入れてしまいたい。

おおまかに図解すると以下の通りです。
image.png

関連情報

  1. https://www2.everestgrp.com/reportaction/EGR-2020-38-R-3626/Marketing

8
4
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
8
4

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?