IDP (Intelligent Document Processing) の概要
IDP (Intelligent Document Processing) は、画像や PDF などの非構造化コンテンツのドキュメントからデータを抽出し、構造化されたコンテンツに変換するプロセスを自動化する機能です。
従来の文書処理では、請求書や領収書、契約書、本人確認書類などの文書から手作業でデータを入力・検証する必要があり、運用遅延、不正確さ、およびコスト増加の原因となっていました。
IDP は、この手作業を削減し、データ抽出と処理時間を大幅に加速します。例えば、Workato の IDP では、文書あたりの処理時間を 8〜10 分から 20〜30 秒に短縮できるとされています。
IDP のユースケース
| ユースケース | 詳細 |
|---|---|
| 勘定支払い | 手動で請求書の詳細を抽出してシステムに入力している場合、IDP は請求書からデータ抽出を自動化し、手動入力を排除して正確性を保証します。 |
| 経費管理 | 従業員が手動で経費を入力している場合、IDP が領収書や請求書からデータを抽出し、経費精算と払い戻しプロセスを簡素化します。 |
| 調達と支払い | 調達チームは請求書と納品書をシステムの記録と相互参照しますが、IDP はデータを抽出し、不一致を特定してレビューに回します。 |
| 受注と入金 | システムに入力する前に営業チームが手動で注文書を処理し、その詳細を抽出して情報を検証している場合、IDP は注文書データを自動的に抽出して規則に従って検証することで、処理時間を削減します。 |
| 本人確認 | 提示された身分証明書の画像を目視でシステムに入力している場合、IDP が代わりにデータを抽出することで正確に入力されることを担保します。 |
| 人事面接 | 提出された大量の履歴書を IDP を用いて構造化されたコンテンツに変換することで、入力された情報の整理や比較が容易になります。 |
Workato の IDP (IDP by Workato) について
IDP by Workato は従来の文書処理方法の課題を克服し、AI を活用することで企業のワークフローを劇的に改善するように設計されています。
IDP by Workato は以下のような強みがあります。
圧倒的な処理効率とスピード
IDP の最大の強みの一つは、「手動作業の排除」と「高いスケーラビリティ」で文書処理にかかる時間を劇的に短縮し、業務の効率を高める点です。
LLM による柔軟な AI 機能と高い精度:
従来の OCR やテンプレートベースのシステムとは異なり、Workato の IDP は LLM を活用することで、テンプレートが不要な柔軟性を実現しています。
-
テンプレート/トレーニング不要:
従来の文書自動化が OCR モデルのトレーニングや硬直したテンプレートの構築を必要としたのに対し、Workato IDP はトレーニングを一切必要としません。 -
コンテンツベースの理解:
文書レイアウトの変化に左右されず、文書のコンテンツを読み取って処理します。 -
高い抽出精度:
標準で 90% 以上の抽出精度を実現しています。 -
多様な文書タイプへの対応:
- 自由形式のスキーマ (Free-form schemas) をサポートしており、文書の構造に関わらず、あらゆる種類の文書を処理できます。
- 請求書、領収書、注文書などの構造化文書のほか、履歴書や身分証明書などの半構造化文書も処理できます。
多言語・多様な形式への対応:
グローバルなビジネス要件に対応できる幅広い形式と言語をサポートしています。
-
多言語サポート:
英語、中国語、日本語、韓国語の請求書や領収書において高い抽出精度を達成しています。 -
手書き文字の処理:
手書きの文字を含む多様な文書にも対応しています。 -
複数のファイル形式:
PDF、PNG、JPG、WebP、GIF 形式のファイルをサポートします。 -
マルチページ対応:
マルチページ PDF を容易に処理できます。
信頼性を保証する検証メカニズム
AI のスピードと人間の精度を融合させる検証プロセスが組み込まれています。
-
信頼スコア (Confidence Scores):
抽出された各値に対して信頼スコア (0から1の数値) が提供されます。これにより、ユーザーはデータの確実性を迅速に評価し、フィルタリングや優先順位付けを効率的に行えます。 -
自動検証と人間によるレビュー (HITL: human-in-the-loop):
信頼スコアが設定された閾値(例: 0.95以下)を下回った場合、自動的に人間にレビューが回されます。これにより、データがバックエンドシステムに送信される前に人間が確認・修正でき、最高のデータ整合性と精度が保証されます。 -
ワークフロー内でのオーケストレーション:
IDP は Workato プラットフォームに直接組み込まれているため、データの抽出だけでなく、その後のルーティング、アクションのログ記録、人間へのエスカレーションといったエンドツーエンドのビジネスプロセス自動化が可能となります。
制限
IDP by Workato を導入よおび評価する際には、制限事項や考慮事項について十分に理解することが重要です。
IDP は強力な自動化ツールですが、処理できる文書のサイズ、データの構造、および入力の品質に関して特定の制約が存在します。
IDP by Workato には以下のような制限が存在します。
サポートされているファイル形式
その他制限と考慮事項
IDP by Workato の導入手順
-
特定の Google Drive のフォルダに「請求書」という名前を含むファイルがアップロードされたことをトリガーにレシピを起動します。

-
[Action in app] から [IDP by Workato] を追加します。
-
[Classify a document using IDP by Workato] を選択し、必要な値を入力します。
この操作では、与えられたが画像または PDF ファイルを分析し、この書類を分類します。
この手順は必須ではなく、請求書のみが指定した Google Drive のフォルダにアップロードされる場合は、必要はありません。

-
さらに、[Action in app] から [IDP by Workato] を追加します。
-
[Process a document using IDP by Workato] を選択し、必要な値を入力します。
一旦、書類の構造 (言語や記載の内容、情報の位置など) を記載する Description は空白にします。

-
レシピを [Save] して [Test recipe] します。
実行結果
以下のサンプルの請求書の画像を Google Drive のフォルダに格納してレシピを実行しました。
結果 1: (Classify a document using IDP by Workato)
[Confidence scores] を確認すると、99.99% の正確性でこの書類は「請求書」であると分類されました。
結果 2: (Classify a document using IDP by Workato)
以下のように撮影した画像ファイルからデータを抽出することができました。
さらに、[Confidence scores] を確認すると、 基本的には 99% 以上の正確性で値が入力されていることが確認できます。
さらに活用するために
アップロードした書類を解析して書類の内容を分類できるため、書類に応じて処理を切り替えることが可能です。
他にも、正確性をさらに上げるためには、[Process a document using IDP by Workato] アクションの [Description] 項目に文章の構造を追記したり、デフォルトで用意されている [Document type] の変更、Document Type を設定した後に表示される [Fields to identify] を追加・編集することなどで実現ができます。
まとめ
今回は IDP by Workato の概要やユースケース、特徴や実装方法について記載しました。
ドキュメントをデータ化する従来の OCR 技術とは一線を画す機能になるかと思います。
この機能を活用することにより、手動による間違いや、かかる時間を削減することができます。




