More than 1 year has passed since last update.

UiPath Document Understanding 第8回実践編新機能のワンクリック抽出器を使用して自社のドキュメントを処理しよう

Last updated at 2023-09-15Posted at 2023-09-12

第7回では、AI Centerを利用してAIモデル（InvoicesJapan（請求書 - 日本） - ML パッケージ）を再トレーニングする方法、および再トレーニング済みのAIモデルの利用方法について説明しました。Studioで利用できるエンドポイントを発行するために、AI Centerでは以下ような複数の操作が必要でやや複雑です。

2023.4のDocument Understandingでは、よりシンプルに上記のことができるようになりました。この記事で説明するワンクリック抽出器作成機能を利用すれば、AIに詳しくなくてもMLモデルのデプロイまで簡単に実現できて、第7回と同じことができるようになりました。

この記事で必要なデータ、及びサンプルワークフローはこちら(08.Oneclick_extrator)にアップロードしましたので、ご利用ください。

1. Document Understandingでのプロジェクト作成及び関連設定

プロジェクトでは、ドキュメントの種類定義や分類器及び抽出器の作成ができます。

プロジェクトの作成

手順：

UiPath Document Understanding を開きます。
[新しいプロジェクト] ボタンをクリックします。
[新しいプロジェクトを作成] ウィンドウで、名前やOCRメソッドを入力します。今回は日本語請求書の処理をするので、OCRメソッドでは[UiPath Chinese-Japanese_Korean OCR]を選択します。

ドキュメント種類の作成

手順：

プロジェクトの画面にて、[新しいドキュメントの種類]-[半構造化AIを使用] ボタンをクリックします。
次の [新しいドキュメントの種類を作成(半構造化AI)] 画面で、必要な項目を入力して作成します。
- ドキュメントの種類を「Invoices Japan」にします。
- 今回の請求書のサンプル帳票で、５種類の請求書ですので、レイアウト数を５にします。
不要な標準フィールド及び列フィールドのチェックを外して、必要な項目だけを残ります。参考までに、残ったのは：
- 標準フィールド：
  - Vendor Name
  - Billing Name
  - Invoice Number
  - Total Amount
- 列フィールド：
  - Description
  - Quantity
  - Unit Price
  - Line Amount

ドキュメントのラベリング

次は、Document Managerでドキュメントのラベリングを実施します。

手順：

Document Manager画面で、[インポート] をクリックして、用意したサンプルドキュメントをアップロードします。
アップロード及び次のインポートをクリックします。
以下の画面で、各ドキュメントに対してラベリングを実施します。ラベリング方法は第七回でのドキュメントラベリングと同じですので、そちらをご参照ください。
右上の予測ボタンと併用しながら作業すると、さらに効率的にラベリングできます。
繰り返して全てのページをラベリングします。