📄 「表やグラフの入ったPDF、どうやってAIに読ませるの?」
※2025/09/22時点の検証結果で今後大幅に改善する可能性があります。Databricks
ai_parse_document関数が2025/09/22にV2になりました。
さっそくPDFから半構造化データを抽出する実験して改善されてるか確認しました。結果は驚きの連続──基本的な表は難なく解析、でもナポレオンの進軍ルートは…?
本記事では、以下のような “人間でも難しいPDFの図解” にAIがどこまで対応できるのか、実例つきで限界に挑戦した記録をまとめました。
- 表・グラフ・散布図
- 数学の公式(ナビエ–ストークス方程式)
- ヒートマップ、路線図、航空図、サンキー図…
📌 PDFから欲しい情報をどう抽出するかに悩んでいる方、生成AIを業務に使いたい方、Databricksユーザー必見です!
🔍 1. Agent Bricks の「情報の抽出」機能を徹底解説!
上図は、Databricks Agent Bricks の「情報の抽出(Information Extraction)」ユースケース画面です。
Unity Catalog Volume上でPDFを読み込むと、自動的に ai_parse_document が裏で働き、PDF内容を半構造化してUnity Catalog Tableへ格納します。
- 「PDFを使用」ボタンをクリックするだけで、PDF → Unity Catalog テーブルへの読み込みがスタート
- 背後で
ai_parse_documentSQL関数が呼び出され、ドキュメントのページ番号・ヘッダー・本文・表・図などをJSON形式で出力 - UI上ではビジュアルな操作に見えますが、実態は SQLコードの裏側で自動化された処理
💡 2.何ができる?主なユースケース
-
契約書や請求書の自動情報抽出
PDFから顧客情報や日付、金額などを抜き出してデータベースへ格納。RPA不要。 -
社内報告書・レポート構造の解析
見出しや表、本文などをjsonでレイアウト保持。 -
大量ドキュメントのまとめ処理
テキスト中心のPDFを読み込み、エージェントに大量の例を学習させることで業務自動化が可能
🧪 2. 今回使った検証PDFの中身
PDFには以下のような 図・グラフ・ビジュアル構造 を含んでいます:
- 基本パターン(表、折れ線、棒グラフ、ヒストグラム、円グラフ、箱ひげ図)
- 応用パターン(ナビエ–ストークス方程式、ヒートマップ、サンキー図、天体図、航空図など)
✅ 3. 基本図表はほぼOKだが苦手なグラフもあり
⚠️ 4. 難関チャレンジ:応用図表はどうか?
数学要素のある図が得意ですね!
| 図表名 | 結果 | ai_parse_document結果 | Claudeで再レポート化 | 新バージョンの結果 |
|---|---|---|---|---|
数学の公式(ナビエ–ストークス方程式)
|
✅ | ![]() |
![]() |
差異なし |
サンキー図(ナポレオンロシア侵攻)
|
❌ | ![]() |
➖ | 差異なし |
ヒートマップ地図
|
❌ | ![]() |
➖ | 差異なし |
手話
|
❌ | ![]() |
➖ | 差異なし |
楽譜 https://www.youtube.com/watch?v=ctWjdoXV4i4
|
❌ | ![]() |
➖ | 差異なし |
べん図
|
✅ | ![]() |
![]() |
差異なし |
リスクマトリックス
|
✅ | ![]() |
![]() |
差異なし |
作業分解図
|
✅ | ![]() |
![]() |
差異なし |
天体図
|
❌ | ![]() |
➖ | 差異なし |
路線図
|
❌ | ![]() |
➖ | 差異なし |
航空図
|
❌ | ![]() |
➖ | 差異なし |
🧠 5. ai_parse_document の限界とは?
- グラフは得意なものと苦手なものがある
- 楽譜・地図などの意味的抽出は苦手だが、数学的な図は得意
🔚 まとめ
ai_parse_document は強力だが、万能ではない。
PDFに含まれるビジュアル情報の意味解釈には、追加のAIアプローチが必要。
しかし、業務における帳票処理・レポート解析には十分実用的!




























































