0
0

【UiPath】非構造化データと構造化データについて

Last updated at Posted at 2024-06-20

UiPath AI-Powered Automation Summit Tokyo

6/18(火) 六本木の東京ミッドタウンでUiPathのカンファレンスに行ってきました。
すべての講演を聞くことはできませんでしたが、今回のテーマはAIでしたが、本質は 「AIによって、非構造化データの取り扱いが容易になった」 ことだと思いました。
まずは、非構造化データとはどのようなデータなのか説明します。

非構造化データと構造化データの違い

・非構造化データ

PDFファイルや画像ファイルといったデータで、特定の情報を狙って取得することが困難なデータを指します。
具体的な例
例えば、以下は出張申請書のPDFとなりますが、赤枠部分の情報をUiPathで取得するには困難でした。セレクターで選択してもうまく取得できなかったり、仮に取得できたとしても、書式が変わっていることで、エラーとなったりと、デリケートで自動化には向きません。
image.png

・構造化データ

そこで、ロボットが読みやすい形で申請書をExcelなど、機械に命令して取得しやすい形のデータに変更して運用していたと思います。
以下のように、申請日の記載セルをH6の定数とすることで、ロボットへH6セルの情報を取得するように指示することで、ロボット起動が安定します。
image.png

DCUが自動化にもたらすインパクト

ここからが今回の本題となりますが、DCU(Document Understanding)を使ことで何ができるようになるのか、というと、上記で説明した非構造化データの必要なデータを取得することが容易に行えるようになりました。
DCUができることを列挙すると以下の通りです。

できること 説明
ドキュメントの分類 ドキュメントの種類(請求書、契約書、注文書など)を自動的に識別し、分類することができます。
情報の抽出 ドキュメントから特定のデータ(名前、日付、金額、住所など)を抽出し、構造化データとして保存します。
手書き文字の認識 OCR(光学文字認識)技術を活用して、手書きのテキストをデジタルデータに変換することができます。
テンプレートフリーのデータ抽出 テンプレートに依存せずに、異なる形式のドキュメントから必要な情報を抽出できます。
自然言語処理 テキストの意味を理解し、重要な情報を抽出したり、内容を要約したりすることができます。
ドキュメントのレビューと修正 自動抽出されたデータを人間が確認し、必要に応じて修正するためのインターフェースを提供します。
ワークフローの自動化 抽出されたデータを基に、請求書処理や契約書管理などのビジネスプロセスを自動化します。
スケーラビリティ 大量のドキュメントを迅速に処理し、大規模なドキュメント処理業務にも対応可能です。

まとめ

今回のUiPath AI-Powered Automation Summit Tokyoでは、AIの進化がビジネスプロセスの自動化に与える大きな影響を実感しました。特に、非構造化データの取り扱いが飛躍的に向上したことが印象的でした。従来、非構造化データの処理は非常に困難であり、多くの手間とコストがかかるものでした。しかし、UiPathのDCUを活用することで、これらの課題が大幅に解消されました。

DCUの導入により、以下のようなメリットが得られます:

メリット 説明
非構造化データの効率的な処理 PDFや画像から必要な情報を抽出する作業が自動化され、時間と労力を大幅に削減。
業務の正確性と一貫性の向上 手動によるデータ入力ミスが減り、業務の品質が向上。
スケーラビリティ 大量のドキュメントを短時間で処理でき、大規模な業務にも対応可能。
柔軟な適用 テンプレートに依存せず、多様な形式のドキュメントからデータを抽出できるため、さまざまなビジネスシナリオに適用可能。

このように、DCUを活用することで、企業はより効率的で信頼性の高い業務プロセスを構築することができます。AI技術の進化は今後も続き、さらに多くのビジネス課題が解決されることが期待されます。UiPathの取り組みは、AIによる業務自動化の未来を切り開く一歩であり、その可能性を強く感じることができました。
次回はDCUを使用して、非構造化データから構造化データへ変換する事例を試したいと思います。
記事:【UiPath】DCU活用事例

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0