1
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

【UiPath】IXP(最新の生成AI抽出器)をつかってみた感想📝

Last updated at Posted at 2025-08-15

はじめに

  • 本記事は、IXP(Intelligent Xtraction and Processing / マルチモーダルなデータ抽出機能)を試験利用した際の所感を書いたものです。
  • 扱うドキュメントの種類:非構造化ドキュメントと複雑なドキュメント
  • 記事の内容は、個人の見解または確認結果であり、UiPath の公式見解ではありません。
  • 製品仕様や参考画像は2025年8月8日時点のもので構成しています。

IXPについて

これまで、入り口が分かれていた ➀Communication Mining(短い非構造データ用)➁Document Understanding(構造・半構造Doc用) に、➂複雑な非構造Doc用の抽出機能が追加、合体したデータ抽出の総合商社サービスです。
本記事では➂番の抽出機能を扱います。

IXP の 非構造化ドキュメントや複雑なドキュメントの機能。最大 50 ページのドキュメントを処理できます。これは一時的な制限であり、今後のリリースで増加される予定です。
image.png

UiPath IXP のクイックツアー

IXP1.png

「ツアーを開始」ボタンをクリック

IXP2.png

IXP3.png

IXP4.png

IXP5.png

IXP6.png

モデルの構築操作(非構造化ドキュメントや複雑なドキュメント)

トップページの画面中央上段の「非構造化ドキュメントや複雑なドキュメント」をクリック

IXP7.png

「プロジェクトを作成」より、プロジェクト名を指定しプロジェクトを新規作成します。

IXP9.png

プロジェクトの構築タブの「ドキュメントをアップロード」からモデルを構築したいドキュメントのサンプルをアップロードします。

StudioのDUに慣れている方は、画面中央のタクソノミーから定義しなくて大丈夫?とおもわれるかもしれませんが、ドキュメントをアップロードしてからフィールド追加と予測はできますので、どちらからはじめても大丈夫です!

IXP10.png

(アップロード直後の画面例)
IXP12.png

アップロードしたドキュメントを選択し、「Validate」ボタンをクリックします。

IXP13.png

アノテーション用の画面が表示されますが、まだタクソノミーを定義していないので画面右側のパネルには何も表示されません。

IXP14.png

画面右下の「フィールドグループ」を追加より、フィールドグループを定義します。

IXP15.png

今回は請求書サンプルを読み取るので、フィールドグループとして『請求書_明細』を追加します。

IXP16.png

フィールドグループを追加すると、グループ内の個別フィールドを定義できるようになります。

IXP17.png

フィールドの種類には次の様なものが選択可能です。

  • Boolean:真偽
  • Date:日付
  • Exact Text:無加工のテキスト(参照テキストそのまま)
  • Inferred Text:類推テキスト ※後段の評価セクションで触れます。
  • Monetary Quantity:金額
  • Number:数値

IXP18.png

フィールドの登録には名前・種類・プロンプトの設定が必要です。

IXP20.png

(「請求書_明細」のタクソノミーイメージ)
IXP21.png

(フィールドを定義した直後のアノテーション画面)
IXP22.png

画面右のパネルの右上のグルグルマーク(これが予測ボタンの模様)をクリックします。
(「予測を再計算すると、保存されていないアノテーションは失われます」の警告は「確認」で進めます。)

IXP23.png

!!??ほぼ1秒で予測結果が返ってきました(@_@;)

IXP24.png

読み取ったサンプルの表には4レコードあるため、4件の結果が返却されてきました。

中身を開くとレコードの詳細を確認できます。

IXP25.png
IXP26.png
IXP27.png

タクソノミーの追加

アノテーション画面の右上の「タクソノミーを管理」をクリック
> 「+ フィールドグループ」より『請求書_ヘッダー』グループを追加します。

IXP29.png

ヘッダー項目を任意で追加設定していきます。

IXP30.png

(登録後の一覧イメージ)
IXP33.png

タクソノミー設定後にアノテーション画面に戻ると

!!??衝撃です!!タクソノミー定義中から裏で処理でも走っていたのか!?アノテーション画面に戻ると既に値が抽出されています(;´・ω・)

IXP34.png

抽出結果を補正して確定します。

IXP35.png

確定ボタン押下後に「構築」画面に戻ると、既にプロジェクトスコアまで出ています。。。生成AIだから速いのか?

IXP38.png

パブリッシュ

評価を確認し、初回なのでそのままパブリッシュ画面に進めます。

IXP42.png

画面左上の「パブリッシュ」ボタンを押下します。

IXP43.png

モデルの説明文とデプロイタグ(本番かステージング環境)を指定しパブリッシュします。

IXP44.png

パブリッシュ画面の一覧に、デプロイ済みのモデルが1つ追加されます。

IXP45.png

モデルの利用手順

Studio Webでプロジェクトを新規作成し、「ドキュメントデータを抽出」を配置します。
Document Understanding プロジェクト欄を開き、パブリッシュ済みのモデル(先ほど作成した「invoice_japan」)を選択します。

IXP46.png

プロジェクト選択後に『バージョン』と『ドキュメントの種類』の指定欄が表示されるので、パブリッシュ時に設定したデプロイタグと「Default」を選択します。

IXP47.png

ドキュメントの種類には「Use Classification Result(分類結果)」か「Default」が指定可能で、
Use Classification Result(分類結果)の使用オプションは、ドキュメント データの生成オプションがオフになっており、選択したプロジェクトに生成 AI 抽出器ではない抽出器が含まれている場合にのみ使用できます。

出力のドキュメントデータオブジェクトのDataプロパティに「請求書ヘッダー」と「請求書明細」のフィールドグループを確認できます。

(式サンプル)

  • ドキュメントデータ.data.請求書ヘッダー
  • ドキュメントデータ.data.請求書明細

IXP48.png

フィールドグループ毎に「繰り返し(コレクションの各要素)」で値を取り出します。

IXP50.png

currentItemのプロパティから出力したいフィールドを選択します。

IXP49.png

(出力例)
IXP51.png

評価・チューニング

出力形式については、タクソノミー定義時に選択した『フィールドの種類』の影響を受けるため、たとえば「Date」のフィールドであれば「yyyy-MM-dd」で必ず出力されます。
プロンプトに「yyyy/MM/dd 形式で出力してください。」と指定したとしても無視されます。

当初、「Exact Text:無加工のテキスト(参照テキストそのまま)」をフィールドの種類に指定した支払期日について、プロンプトで出力形式を指定しても『2023年10月末日』と出力されたため、「Date」のフィールド種類に変更しました。

フィールドの種類をアノテーション後に変更する場合、以前にパブリッシュ済みのモデルに戻す以外は方法がなくなるため、未パブリッシュの場合はフィールド変更前にパブリッシュしておくことをお勧めします。

IXP39.png

なお、プロンプトで指定した任意の出力形式を優先したい場合、「Inferred Text:類推テキスト」を利用すればOKです!

IXP_52.png

警告マークがついているフィールドのマッピングを見直します。
(現時点では機械学習に未対応のため、アノテーション後に予測結果は変わりません(アノテーションした数も数枚のため、絶対とは言えませんがそこはご容赦)=警告マーク自体は消えなくてもアノテーション作業を実施すればスコアは上がります)

IXP_53.png

金額フィールドなどは予測にカンマがつかず不一致を解消できませんが、マッピングはあっているので無視して進めます。

IXP_54.png

マッピング(参照)の見直しをおこなっただけで、56%から86%までスコアは改善しました。

IXP_55.png

再パブリッシュ

画面左上の「パブリッシュ」ボタンを押下し、前回同様に説明文とデプロイタグを選択します。

IXP_56.png

再パブリッシュはすぐに完了します。
一覧には最新バージョンのモデルが選択したデプロイタグで追加されます。

IXP_57.png

デプロイタグの変更や取り下げの操作は三点リーダーからおこなえます。

IXP_58.png

さいごに

今回の試験利用では、予測結果が実際の値と一致するのにどの程度の学習が必要か、また複数値の取り扱いなどが不明でしたが、モデルの構築方法やWF内での使い方は直感的でわかりやすく、日本語のスキャンデータで問題なく値抽出された点は良かったとおもいます。
まだプレビュー版ですが、パッとつかった感じでは品質問題も確認しなかったので一般向けリリースが待ち遠しいですね(´ω`)

1
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?