LoginSignup
6
1

【UiPath】新しいモデル学習体験「Active Learning」 - 基本操作編

Last updated at Posted at 2024-05-31

はじめに

  • 本記事では、UiPath Document Understanding の新しいモデル学習体験「Active Learning」を紹介します。
  • 記事の内容は、個人の見解または確認結果であり、UiPath の公式見解ではありません。
  • 製品仕様や参考画像は 2024年5月30日時点のもので構成しています。

新しいモデル学習体験「Active Learning」とは

従来はカスタムAIモデルを作成するのに
Document Manager でアノテーションして、データセットを AI Center に連携し、MLパッケージを用意したらパイプライン管理でトレーニングして、最後にMLスキルにデプロイ
といったアクションが最低でも必要でした。
データセットの選定や再編集、トレーニング時の設定やスコア確認など
文字にするとたいしたことなさそうな上記のアクションも、実際には案外煩雑な設定作業を多く含んでおり初心者には利用の難しいサービスでした。

これが、Active Learning(アクティブラーニング)になると
Document Manager でアノテーションして、パブリッシュ
で済むんです。※トレーニングは裏で自動で走ります。

スコアも各フィールドのF1スコアをみるとかではなく、シンプルに分類または抽出のスコアをみるだけでOK

Active Learning では、モデルや機械学習の基礎知識がなくても、直感的な操作でAIモデルを作成できます!

基本操作 - プロジェクト作成からパブリッシュまで

アクティブラーニング1.JPG

「プロジェクトを作成する」>「モダン」を選択します。
(※OCRは最新の「UiPath Extended Language OCR」を指定するのをお勧めします。)

アクティブラーニング2.JPG

「構築」画面の「クリックして参照」から学習させたいドキュメントをアップロードします。

アクティブラーニング3.JPG

請求書のサンプルドキュメントを210枚ほどアップしてみます。

アクティブラーニング4.JPG

アップロード後に、モデルの雛型がある場合は次の様に自動分類されます。
(請求書のサンプルをインポートしたので、「請求書 - 日本」と自分分類されています。)

アクティブラーニング5.JPG

画面右側には、分類と抽出に関するレコメンド(メッセージ)が表示されます。
次の例では、分類するにはドキュメントを1つ以上学習させる様にとメッセージがあります。

アクティブラーニング6.JPG

自動分類の「クリックして参照」より、領収書のサンプルをインポートしてみます。

アクティブラーニング7.JPG

インポート後のアクションですが、選択可能な操作は次の様になっています↓↓

  • 編集アイコンを押下するとDocument Managerが起動し、アノテーション作業をおこなうことができます。

アクティブラーニング9.JPG

  • ↑アイコンを押下すると対象ドキュメントへの追加アップロードができます。

アクティブラーニング10.JPG

  • 三点リーダーからはドキュメントの削除またはDocument Managerの起動ができます。

アクティブラーニング11.JPG

自動分類の↑アイコンからアップロードする場合、モデルの雛型がないと自動分類のセクションにドキュメントが残ります。
この場合、三点リーダー>「移動先」>「新しいドキュメントの種類」より分類先を作成し振り分けます。

アクティブラーニング12.JPG

ドキュメントの種類名称に利用できる文字は、アルファベット、数字、アンダースコア、スペースのみです。

アクティブラーニング13.JPG
アクティブラーニング14.JPG

複数のドキュメントを一気に移動したい場合、個別レコードの操作(三点リーダー)からではなく、画面上部の「移動先」ボタンからおこないましょう。

アクティブラーニング16.JPG

分類作業が完了したら、対象ドキュメントのアノテーション作業に移ります。
「トレーニング開始前」の文字をクリックすると次の様なダイアログが表示されます。
「注釈」ボタンを押下しアノテーション作業をおこないましょう。

アクティブラーニング18.JPG

クラシックのDocument Managerでは、ドキュメントの読み込み~予測で数秒以上かかるのですが、画面中央の描画を除けばモダンは1秒で返ってきます!!(;・∀・)

アクティブラーニング24_口座情報が標準で追加された2.JPG

さらに、数日前にリリースされた日本語の請求書の最新モデルには口座系のフィールドが初期状態から存在します!!!

アクティブラーニング24_口座情報が標準で追加された.JPG

以前の請求書モデル(日本語)では、Payment Address に口座情報をすべて結合した値が入っていました。
このため、手動で「銀行名」「支店名」「口座番号」といったフィールドを追加した上でアノテーション作業をおこなう必要がありました。

アクティブラーニング20.JPG

アノテーション後にトレーニングは自動で走ります。

アクティブラーニング25.JPG

アノテーション作業が終わったら、評価画面でスコアやレコメンドを確認します。
今回は基本操作の案内のため、このままパブリッシュに進みます。

アクティブラーニング27_15枚ラベリング直後.JPG

パブリッシュ画面で「プロジェクトのバージョンを作成」ボタンを押下します。

アクティブラーニング28.JPG

デプロイ後のモデルの名称(Studioのアクティビティで選択する際に表示される名称)と、デプロイ対象のドキュメントを選択します。

アクティブラーニング29.JPG

トレーニングが済んでいるので、パブリッシュもあっと言う間でした!
あとはデプロイ済みの列のトグルを有効にすれば作業完了です!!

アクティブラーニング30.JPG

さいごに

いかがでしたでしょうか?
一度体験してしまうとクラシックプロジェクトには戻れなくなりそうですよね。。。
次回は、Active Learning で作成したモデルのStudioでの使い方やスコアの遷移などの参考情報を書きたいとおもいます。
最後までお読みいただきありがとうございます(・ω・)ノ

6
1
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
6
1