1
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

先日書いたai_parse_document関数がAgent Bricksに組み込まれました。

こちらのアップデートです。

Agent BricksでのPDFの使用(Beta)
Agent BricksではPDFをマークダウンに変換し、テーブルに格納するUIのワークフローを提供します。ユーザーは、Agent Bricks: 情報抽出カスタムLLMでの入力として結果のテーブルを使用することができます。

注意
執筆時点ではベータ版であり、日本リージョンでは利用できません。

事前にボリュームにPDFファイルを格納しておきます。
Screenshot 2025-06-28 at 10.51.42.png

Agent Bricksにアクセスすると右上にAgent Bricks で PDF を使用するボタンが表示されています。
Screenshot 2025-06-28 at 10.44.06.png

ボリュームのフォルダ、登録先のテーブルを指定します。
Screenshot 2025-06-28 at 10.44.19.png

インポートを開始をクリックします。
Screenshot 2025-06-28 at 10.46.29.png

Screenshot 2025-06-28 at 10.46.44.png

成功しました。
Screenshot 2025-06-28 at 10.52.46.png

パーシングの結果がテーブルに登録されています。
Screenshot 2025-06-28 at 10.53.33.png

情報の抽出を行ってみます。上のテーブルを選択します。
Screenshot 2025-06-28 at 10.54.16.png

サンプル出力の時点でいい感じです。エージェントの作成をクリックします。
Screenshot 2025-06-28 at 10.55.08.png

適切に請求書の構造が抽出されています。
Screenshot 2025-06-28 at 10.56.57.png

これで情報抽出エージェントを作成できました。
Screenshot 2025-06-28 at 10.57.38.png

ドキュメントがPDF化されていることはよくある話ですので、この機能を活用することで情報抽出のワークフローをより簡単に構築できるようになりそうです。

はじめてのDatabricks

はじめてのDatabricks

Databricks無料トライアル

Databricks無料トライアル

1
1
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?