Azure AIのDocument Intelligence Studioを軽く触ってみた

Posted at 2024-12-30

概要

Azure AIのDocument Intelligence StudioというWebサービスを使うと、トレーニング済みのモデルを利用して、ブラウザで、文書（PDFなど）の解析のデモを試すことができます。

主な機能

Document Intelligence（文書）の主な機能は以下のとおりです。

Read（読み取り）
- 文書の記載内容をデータ抽出する。
Layout（レイアウト分析）
- 文書の、見出し、テキスト、表、図形を読み取る。

どちらもサポートする文書ファイルの拡張子はほぼ同じで、JPEG、PDF、DOCX、HTMLなどを網羅しておりますが、Layoutの方が、リッチテキスト向けの機能という印象を受けました。

どうも、Readがただのテキスト読み取りに特化しているのに対し、Layoutは、文書をHTMLのように構造立てて解析しているようです。（例：ここが見出しで、これが表だな・・、など。）

Document Intelligence Studioとは

Copilotに聞いてみました。

Azure AIのDocument Intelligence Studioは、文書処理を自動化するための強力なツールです。これを使うと、請求書、領収書、名刺などの文書から情報を抽出し、デジタル化することができます。主な機能には以下が含まれます:

ドキュメント分析: 文書内のテキストやレイアウト構造を自動的に検出・抽出します。
カスタムモデル: ユーザー独自のフォーマットや文書タイプに合わせてデータ抽出を最適化できます。
事前構築モデル: 領収書、請求書、名刺などの一般的な文書に対応したモデルを提供します。
手書き文字の認識: 手書きのテキストをデジタルデータに変換します。
ドキュメント分類: さまざまな種類の書類を自動で認識し、分類します。
このツールを使うことで、業務効率を大幅に向上させることができます。

URLはこちらです。