9
2

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

2025/09/22時点【Agent Bricks爆誕】Databricks × ai_parse_document で PDF図表を読み解く!生成AIが挑む「ドキュメント解析の壁」

Last updated at Posted at 2025-07-25

📄 「表やグラフの入ったPDF、どうやってAIに読ませるの?」
※2025/09/22時点の検証結果で今後大幅に改善する可能性があります。

Databricks ai_parse_document 関数が2025/09/22にV2になりました。
さっそくPDFから半構造化データを抽出する実験して改善されてるか確認しました。

結果は驚きの連続──基本的な表は難なく解析、でもナポレオンの進軍ルートは…?

本記事では、以下のような “人間でも難しいPDFの図解” にAIがどこまで対応できるのか、実例つきで限界に挑戦した記録をまとめました。

  • 表・グラフ・散布図
  • 数学の公式(ナビエ–ストークス方程式)
  • ヒートマップ、路線図、航空図、サンキー図…

📌 PDFから欲しい情報をどう抽出するかに悩んでいる方、生成AIを業務に使いたい方、Databricksユーザー必見です!


🔍 1. Agent Bricks の「情報の抽出」機能を徹底解説!

image.png

上図は、Databricks Agent Bricks の「情報の抽出(Information Extraction)」ユースケース画面です。
Unity Catalog Volume上でPDFを読み込むと、自動的に ai_parse_document が裏で働き、PDF内容を半構造化してUnity Catalog Tableへ格納します。

  • 「PDFを使用」ボタンをクリックするだけで、PDF → Unity Catalog テーブルへの読み込みがスタート
  • 背後で ai_parse_document SQL関数が呼び出され、ドキュメントのページ番号・ヘッダー・本文・表・図などをJSON形式で出力
  • UI上ではビジュアルな操作に見えますが、実態は SQLコードの裏側で自動化された処理
    image.png

💡 2.何ができる?主なユースケース

  • 契約書や請求書の自動情報抽出
    PDFから顧客情報や日付、金額などを抜き出してデータベースへ格納。RPA不要。
  • 社内報告書・レポート構造の解析
    見出しや表、本文などをjsonでレイアウト保持。
  • 大量ドキュメントのまとめ処理
    テキスト中心のPDFを読み込み、エージェントに大量の例を学習させることで業務自動化が可能

🧪 2. 今回使った検証PDFの中身

PDFには以下のような 図・グラフ・ビジュアル構造 を含んでいます:

  • 基本パターン(表、折れ線、棒グラフ、ヒストグラム、円グラフ、箱ひげ図)
  • 応用パターン(ナビエ–ストークス方程式、ヒートマップ、サンキー図、天体図、航空図など)

✅ 3. 基本図表はほぼOKだが苦手なグラフもあり

図表名 結果 ai_parse_document結果 Claudeで再レポート化 新バージョンの結果
image.png image.png image.png 差異なし
散布図 image.png image.png 差異なし
縦棒グラフimage.png image.png image.png 差異なし
縦棒グラフimage.png image.png 🥲 精度低下
横棒グラフimage.png image.png image.png 差異なし
ヒストグラムimage.png image.png image.png 🥰 精度向上も不正確
折れ線グラフimage.png image.png image.png 差異なし
折れ線グラフimage.png image.png image.png 🥰 精度向上も不正確
面グラフimage.png image.png image.png 🥰 精度向上
円グラフimage.png image.png image.png 差異なし
箱ひげ図image.png image.png image.png 🥰 精度向上
カーネル密度推定image.png image.png image.png 差異なし

⚠️ 4. 難関チャレンジ:応用図表はどうか?

数学要素のある図が得意ですね!

図表名 結果 ai_parse_document結果 Claudeで再レポート化 新バージョンの結果
数学の公式(ナビエ–ストークス方程式)image.png image.png image.png 差異なし
サンキー図(ナポレオンロシア侵攻)image.png image.png 差異なし
ヒートマップ地図image.png image.png 差異なし
手話image.png image.png 差異なし
楽譜image.pnghttps://www.youtube.com/watch?v=ctWjdoXV4i4 image.png 差異なし
べん図image.png image.png image.png 差異なし
リスクマトリックスimage.png image.png image.png 差異なし
作業分解図image.png image.png image.png 差異なし
天体図image.png image.png 差異なし
路線図image.png image.png 差異なし
航空図image.png image.png 差異なし

🧠 5. ai_parse_document の限界とは?

  • グラフは得意なものと苦手なものがある
  • 楽譜・地図などの意味的抽出は苦手だが、数学的な図は得意

🔚 まとめ

ai_parse_document は強力だが、万能ではない。
PDFに含まれるビジュアル情報の意味解釈には、追加のAIアプローチが必要。

しかし、業務における帳票処理・レポート解析には十分実用的!


9
2
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
9
2

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?