LoginSignup
6
5

【UiPath】バージョン「23.4」AI / Document Understanding 機能改善紹介

Last updated at Posted at 2023-09-06

はじめに

  • 本記事では、UiPath バージョン 23.4 の AI / Document Understanding の機能改善を幾つかピックアップして紹介します。
  • 記事の内容は、個人の見解または確認結果であり、UiPath の公式見解ではありません。
  • 製品仕様や参考画像は 23.4 バージョンで構成しています。

目次

今回紹介する内容は下記になります。

# 1)フィールドのルール設定機能
# 2)データ抽出オートメーションビルダー
# 3)ワンクリック分類器作成
# 4)ワンクリック抽出器作成
# 5)Document Understanding Cloud APIs(DUのWebAPI)

1)フィールドのルール設定機能

23.4_17.JPG
タクソノミーマネジャーの各フィールドの設定に「ルール」タブが追加されました。
「ルール」タブでは、フィールドのバリデーションを設定することができます。
重要度レベルは「Must」か「Shoud」を指定でき、「Must」であればルールに合致しない場合、検証ステーションでSubmitできません。
23.4_24.JPG
なお、設定可能なルールはフィールドのルールに依って変わります。
例えば、日付(Date)であれば「空でない」と「予想される値」が利用できます。
23.4_21.JPG
名前(Name)や住所(Address)であれば、「空でない」「次で始まる」「次で終わる」「次の値を含む」「固定長」「正規表現」が選択できます。
23.4_22_name_address.JPG
数値(Number)の場合、「空でない」「予想される値」に加えて 「式」 が指定できます。
23.4_20.JPG
0円以上の例
23.4_23.JPG
最もよく使われる文字(Text)の場合、「空でない」「次で始まる」「次で終わる」「次の値を含む」「固定長」「正規表現」に加えて 「予想される値」と「メールアドレス」 などが指定できます。

2)データ抽出オートメーションビルダー

23.4_25.JPG
データ抽出オートメーションビルダーを使えば、ほぼワンクリックのノリで、ドキュメントからOCRでデータを読み取って処理するワークフローを作れます!!(@_@)

[使い方]

  1. 「開始」のリンクをクリック
  2. 読み取りたいドキュメントをドラッグ&ドロップ
  3. 「ワークフローを作成」ボタンをクリック
    23.4_26.JPG
    ↓↓↓
    23.4_27.JPG
    たったコレだけでワークフローが出来上がる↓↓
    23.4_28.JPG

2023/09/01時点では、プロジェクト名に日本語が含まれているとジョブの実行ができません。(ASCIIエラーが発生します。)
→ プロジェクト名を英字のみとすれば問題なく実行できます。

23.4_29.JPG
実行すると Action Center に読み取り結果が連携されるので、内容を確認・送信し、「再開」ボタンをクリックしてワークフローを進めます。
23.4_30.JPG
出力パネルをみると、値が取得できてることを確認できます。
23.4_31.JPG

3)ワンクリック分類器作成

23.4_0.JPG
Document Understanding の分類器の画面から、ワンクリックで『分類器』を作成できるようになりました!!

前提として、分類対象となる「ドキュメントの種類」はあらかじめ作成しておく必要があります。

「新しい分類器」ボタンをクリックし、「自動トレーニング」 を選択してください。
(手動トレーニングを選択するとモデルの学習とデプロイなどの作業を AI Center で手動でおこなう必要があります。)

次に表示されたダイアログで、分類器の名称と分類対象のドキュメントを指定しトレーニングを実行します。
23.4_2.JPG
自動トレーニングが完了すると、以下の様に、利用可能になったMLスキルのエンドポイントをはじめ、データセットやパイプラインのリンクなどが確認できるようになります。
23.4_3.JPG

分類器の再学習について

23.4_6.JPG
分類器の詳細画面からワンクリックで再学習をする機能はありません。
作成済みの分類器を再学習するには、分類器のトレーニング用アクティビティをもちいて、まずデータセットにデータ連携しましょう。

分類器(分類モデル)の初回学習とデプロイはワンクリックで実現できますが、再学習はトレーニング用アクティビティをもちいたデータセットの連携と AI Center での手動トレーニング・デプロイが必要です。
なお、ワークフローで指定した分類器を再指定できる場合は、新たなデータセットをもとにワンクリックで分類器を作成するのもよいでしょう。

「マシンラーニング分類器トレーナー」を配置し、データセットのフォルダ(「データセット」の直下のフォルダが選択可能)を指定することで、対象のドキュメント種類のフォルダにトレーニング用のデータがアップロードされます。

「マシンラーニング分類器トレーナー」は 分類をおこなったすべてのドキュメントデータをデータセットに連携します。 自動分類と検証済みの分類結果に差があるときのみ連携したい場合、本アクティビティの前に「自動分類結果」と「検証済みの分類結果」を比較し、条件分岐する必要があります。

連携済みのデータセットから再学習に必要なデータをトレーニングデータに追加しましょう。
まずは、「データセットをダウンロード」ボタンをクリックします。
モデルの学習関連7.JPG
ダウンロードの準備が完了したら「エクスポート」タブから落としましょう。
モデルの学習関連9.JPG
ダウンロードした「ドキュメント テキスト」データから再学習にもちいるファイルのみ手動でアップロードします。
23.4_9.JPG
パイプラインでトレーニングを実施する際は、以下の2点をご注意ください。

  1. パッケージのマイナーバージョンは「0」を指定する
  2. 入力データセットは分類対象のドキュメント種類の親フォルダを指定する(※抽出器は抽出対象のドキュメント種類のフォルダを指定する)
    23.4_7.JPG
    23.4_8.JPG

マイナーバージョンに「0」を指定するのは、モデル学習における破滅的忘却を避けるためです。
モデルの再学習の例:
 UiPath提供の事前学習済みモデル(v1.0) + トレーニングデータ100件 → v1.1
 【OK】
  UiPath提供の事前学習済み(v1.0) + トレーニングデータ120件 → v1.2
 【NG】
  追加学習済みモデル(v1.1) + 追加のトレーニングデータ20件 → v1.2

パイプラインでの再学習が完了したら、MLスキルを更新しましょう。
モデルの学習関連14.JPG
再学習したのに、分類結果の精度が上がらない(というか全く分類されない)ときは「分類器の設定」を失念している(凡ミス)を疑いましょう↓↓
23.4_10.JPG
Document Manager で定義した「ドキュメント種類」と、ローカルのタクソノミマネジャーで定義したドキュメントの種類を紐づけができていない場合は分類されません。(黄色でハイライトしている部分に値が入っていることを要確認)

4)ワンクリック抽出器作成

23.4_1.JPG
Document Understanding の抽出器の画面から、ワンクリックで『抽出器』を作成できるようになりました!!

前提として、抽出対象となる「ドキュメントの種類」はあらかじめ作成しておく必要があります。

「新しい抽出器」ボタンをクリックし、「自動トレーニング」 を選択してください。
(手動トレーニングを選択するとモデルの学習とデプロイなどの作業を AI Center で手動でおこなう必要があります。)

次に表示されたダイアログで、抽出器の名称と抽出対象のドキュメント、トレーニングに利用する事前学習済みのモデルを指定しトレーニングを実行します。
23.4_4.JPG
自動トレーニングが完了すると、以下の様に、利用可能になったMLスキルのエンドポイントをはじめ、データセットやパイプラインのリンクなどが確認できるようになります。
23.4_5.JPG

抽出器の再学習について

23.4_11.JPG
抽出器の詳細画面からワンクリックで再学習をする機能はありません。
作成済みの抽出器を再学習するには、抽出器のトレーニング用アクティビティをもちいて、まずデータセットにデータ連携しましょう。

抽出器(抽出モデル)の初回学習とデプロイはワンクリックで実現できますが、再学習はトレーニング用アクティビティをもちいたデータセットの連携と AI Center での手動トレーニング・デプロイが必要です。
なお、ワークフローで指定した抽出器を再指定できる場合は、新たなデータセットをもとにワンクリックで抽出器を作成するのもよいでしょう。

「マシンラーニング抽出器トレーナー」を配置し、データセットのフォルダ(「データセット」の直下のフォルダが選択可能)を指定することで、対象フォルダの下に微調整用のデータがアップロードされます。

「マシンラーニング抽出器トレーナー」は 抽出をおこなったすべてのドキュメントデータをデータセットに連携します。 自動抽出と検証済みの抽出結果に差があるときのみ連携したい場合、本アクティビティの前に「自動抽出結果」と「検証済みの抽出結果」を比較し、条件分岐する必要があります。

連携済みのデータセットから再学習に必要なデータを Document Manager でインポートしましょう。
まずは、「データセットをダウンロード」ボタンをクリックし、エクスポートタブの「ダウンロード」リンクからデータセットを取得します。
23.4_12.JPG
取得したデータセットの中に微調整用の「fine-tune」というフォルダが在ることを確認します。
微調整用のデータセットフォルダには「documents」「metadata」「predictions」の3フォルダが含まれます。
23.4_13.JPG
この「fine-tune」フォルダを任意の名称でZip化し、Document Manager でインポートします。
モデルの学習関連23_fine-tuneのZipをインポート.JPG
ガイド参考:
https://docs.uipath.com/ja/document-understanding/automation-cloud/latest/user-guide/document-manager-import-documents#validation-st[…]ataset-import

インポートしたドキュメントデータに、ドキュメント種類で未定義のフィールドが存在すると以下の様なエラーが発生します。
モデルの学習関連23_fine-tuneのZipをインポート_エラー.JPG
この場合、Document Manager で対象のフィールドを追加してから再度インポートすればOKです。
モデルの学習関連23_fine-tuneのZipをインポート_エラー_ドキュメントにフィールドを追加して解消.JPG
Document Manager から AI Center にデータセットを連携したら、パイプラインでトレーニングを実施しましょう。
トレーニング時には以下の設定にご注意ください。

  1. パッケージのマイナーバージョンは「0」を指定する
  2. 入力データセットは抽出対象のドキュメント種類のフォルダを指定する
    23.4_14.JPG
    23.4_15.JPG

マイナーバージョンに「0」を指定するのは、モデル学習における破滅的忘却を避けるためです。
モデルの再学習の例:
 UiPath提供の事前学習済みモデル(v1.0) + トレーニングデータ100件 → v1.1
 【OK】
  UiPath提供の事前学習済み(v1.0) + トレーニングデータ120件 → v1.2
 【NG】
  追加学習済みモデル(v1.1) + 追加のトレーニングデータ20件 → v1.2

パイプラインでの再学習が完了したら、MLスキルを更新しましょう。
23.4_16.JPG

5)Document Understanding Cloud APIs(DUのWebAPI)

23.4_32.JPG
DUの画面の右上の「REST API」から WebAPI の実行ツール(Swagger)を起動できます。

[Framework(デジタル化や分類・抽出などのフレームワークのWebAPI)↓↓]
23.4_34.JPG
[Document Manager(クラウドの Document Manager のWebAPI)↓↓]
23.4_33.JPG
管理 > 組織ID > 外部アプリケーションより、以下のアプリケーションスコープの権限を持つ外部アプリケーションを作成しましょう。

Du.Classification.Api Du.Digitization.Api Du.DocumentManager.Document Du.Extraction.Api Du.Validation.Api

23.4_37.JPG
アプリケーションの種類は「機密アプリケーション」を、
リダイレクトURLは未指定で問題ありません。
23.4_36.JPG
23.4_38.JPG
Swagger のツール画面右上の「Authorize」ボタンクリックし、作成したアプリIDとアプリシークレットを入力しAuthorizeします。
23.4_35.JPG
あとは必要なパラメータ指定して実行するだけ!レスポンスコード200(´ω`)
23.4_39.JPG

終わりに

以上、バージョン 23.4 の AI / DU の主要機能改善紹介でした。
AI / DU をはじめて触った頃、MLモデル、パイプライン、MLスキルなどが何者か全然ピンとこなかったのが懐かしい。
ワンクリック分類・抽出器作成機能があれば、AIに詳しくなくてもMLモデルのデプロイまで簡単に実現できます!Enjoy your Automation Life!

6
5
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
6
5