はじめに
- 本記事は、Document Understanding のクラシックプロジェクトで運用中で、モダンプロジェクトに移行したい方向けの内容です。
- 記事の内容は、個人の見解または確認結果であり、UiPath の公式見解ではありません。
- 製品仕様や参考画像は 24.10 バージョンのもので構成しています。
公式ガイドの手順
基本的には上記のガイドを参考に移行作業は実施いただけますが、幾つか沼ポイントがあるので、これから移行作業をおこなう方はご一読いただくのをお勧めします。
【要チェック】ハマりやすいポイント
✔ クラシックのデータセットをインポートする際は、まず「カスタム」のドキュメント種類をご用意ください
たとえば、請求書(日本語)モデルのデータセットだからといって、請求書(日本語)のドキュメント種類を追加してインポートしても失敗します!
必ず、「カスタム」のドキュメント種類を作成してインポートしましょう!
✔ インポートするZipの直下にschema.jsonが含まれていること
AI Center のデータセットをエクスポート>ダウンロードする場合、抽出器が複数あると次の様なデータセットが出力されます。
(例)
69207d47-5f79-4d67-a01a-30fe0bd17ea0.zip
┗ 抽出器1
┃ ┗ 省略
┗ 抽出器2
┗ images
┗ latest
schema.json
split.csv
上記の状態でインポートすると次のエラー(スキーマファイルがありません)で失敗します。
✔ データセットを再Zipする際は文字エンコードをutf-8に指定すること
OS標準の右クリック>圧縮の場合、環境によって圧縮時の文字エンコードがutf-8以外のこともあります。
✔ Zipを再度インポートした際のエラーメッセージがわかりづらい。。。
『インポートされたデータセットのスキーマがドキュメントの種類「XXX」と一致しません。』
インポートするschema.jsonの末尾をみるとbase_modelのid:nullの記載などがあります。
推測ですが、一度インポートした後はこの辺の指定を変更しないと追加で取り込めないのかもしれません。単純にドキュメントIDを指定するだけではエラーは解消できませんでした。
既に取り込み済みのカスタムモデルに追加のデータセット(Zip)をインポートすることはできません。
ファイル削除をしても同様です。
再度、新しく「カスタム」のドキュメント種類を作成してからインポートしましょう!
さいごに
いかがでしたでしょうか。
皆さまのDUモダンプロジェクトへの移行が少しでも円滑に進めば幸いです。
移行作業自体はポイントさへおさえておけば簡単ですので、UI/UXが改善されたDUモダンプロジェクトへの移行を是非是非ご検討ください。
最後までお読みいただきありがとうございます(・ω・)ノ