14
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

生成AI(Gemini 3)を使ってPDFファイルから必要な情報を抽出してみた

Last updated at Posted at 2025-12-20

はじめに

こんにちは。KDDIアジャイル開発センター(KAG)でスクラムマスターをしている高橋です。
アドベントカレンダーも21日目ということで、クリスマスと年末年始が本格的に近づいてきましたね!

さて、今回は生成AI(Gemini 3)を使ってPDFファイルに記載されている情報を読み取り、対話形式で必要な情報を取得してみたいと思います。
また、あえて誤った情報が含まれているPDFファイルを読み取り、Geminiがどのような挙動をするのか実験してみたいと思います。

すでに生成AIをガシガシ活用されている方にとっては、残念ながらあまり新たな情報は提供できないかと思います。
しかし「実は生成AIまだあまり使ったことがないよ」という方もまだまだいらっしゃることと思いますので、
そういった方にとって当記事が「生成AIちょっと触ってみようかな」と思っていただくきっかけになれば幸いです。

対象読者

  • 生成AIを使ってみたいが実はまだあまり活用できていない、具体的な活用事例を知りたい
  • 業務やプライベートで多くの資料や書籍を読む必要があるが、じっくり読む時間がない
  • Geminiを使ったPDFファイルの解析や要約処理に興味がある
  • Geminiに誤った情報を含むPDFファイルを解析、要約させるとどんな挙動になるのか興味がある

前提条件

  • 今回の記事では生成AIとしてGemini 3を使います
  • 当記事の内容は全て執筆時点(2025年12月20日)でのものとなります
  • Geminiを利用するうえで無料のGoogleアカウントが必要になりますので、もしまだお持ちでない方はアカウントを作成してください

スクラムガイド2020の内容を要約してもらう

早速ですが、Geminiを使ってPDFファイルの要約をやってみようと思います。
まずは無料公開されている「スクラムガイド2020(日本語版)」をGeminiに要約してもらいます。

なお、スクラムガイド2020(日本語版)は以下のリンク先で公開されていますので、
当記事の内容をお手元で再現したい場合は予めファイルをダウンロードしておいてください。

Geminiにファイルをアップロードし、解析してもらう手順

image.png

  1. GeminiのWebコンソールを開き、「+」ボタンをクリックします
  2. 表示されたリストから「ファイルをアップロード」を選択し、スクラムガイド2020(日本語版)を選択してアップロードします
  3. 以下のプロンプトを入力し、Geminiに指示を出します

添付したスクラムガイド(2020)の内容を3分で読める程度の文書に要約してください

Geminiからの回答は以下の通りでした。

image.png

非常にわかりやすく要約されていますね!

次に、対話形式でもう少し詳細な情報を抽出してもらいましょう。

image.png

質問をした箇所について、バッチリ詳細情報を返してくれていますね。

とはいえ、スクラムガイド2020(日本語版)は元々表紙を除き17ページと非常にコンパクトになっており、
Geminiによる要約の恩恵をやや感じづらかったかもしれません。
次は、もっと情報量の多いPDFファイルで試してみましょう。

令和2年 国勢調査の結果を要約してもらう

ということで次は令和2年の国勢調査の結果をGeminiに要約してもらおうと思います。
令和2年の国勢調査の結果のPDFは合計60ページとなっておりました。
(ちなみに令和7年版の国勢調査の結果はまだ公開されておりませんでした)

スクラムガイドのときと同様に、GeminiにPDFファイルをアップロードして内容を要約する指示を出してみます。

なお、国勢調査のPDFファイルは総務省統計局のホームページで公開されているものをお借りしました:
※手元で管理しやすいよう、ダウンロード後にファイル名だけリネームしてあります

image.png

こちらも非常にわかりやすく要約されています。
真面目に全て読もうとするとおそらく1, 2時間はかかるボリュームですので、この内容を3分で読めるくらいに要約してもらえるのは非常に助かりますね。

要約してもらった内容から、気になったところを追加で質問してみました。

image.png

これは非常に便利ですね!
特に3つ目の質問については、回答根拠となるPDFファイルに該当情報が含まれなかったことを伝えてくれています。
その上で関連情報として0歳の人口と0歳 - 4歳の合計人口を教えてくれています。
なんと気が利くのでしょうか。

おまけ:内容が誤りだらけのPDFファイルから、情報抽出とレビューもしてもらった

最後におまけです。
PDFファイルの情報に誤りが含まれている場合、それをGeminiに要約してもらうとどうなるか気になりませんか?
Geminiは誤った情報をそのまま要約してくれるのでしょうか。
それともその部分は正しい情報に直したうえで要約するのでしょうか。

検証のために、わざと間違った情報だらけのPDFファイルを作成し、それをGeminiに渡して情報を抽出するとどのような挙動になるのかを確認してみようと思います。

今回作成した誤りだらけのPDFファイル(生成AI挙動テスト.pdf)の内容がこちらです:

image.png

・・・何やらとんでもない誤情報ばかりですね。

さて、早速ですがGeminiとのやりとりは以下の通りとなりました。

image.png

指示した通り、Geminiに渡したPDFファイルの内容のみを情報源として、質問に回答してくれていますね。
今回のような質問内容では、それが誤っているかどうかは考慮しないようです。

そこで、PDFファイルの内容と事実(一般常識)とを比較し、誤った情報については訂正してもらうように指示を出してみました。
その結果はこうなりました。

image.png

・・・うん?

image.png

なんと、ただ誤った情報を訂正するだけでなく、私が意図的に誤った情報を記載していることまで見抜かれてしまったようです。
Gemini、恐るべし。

さいごに

ここまでお読みいただき、ありがとうございました。
当記事を読んで「生成AI触ってみたいな」「便利だな、面白そうだなー」と思っていただけたなら、嬉しく思います。

生成AIはアイデア次第で本当に様々なことに活用ができそうですね。
こうした技術を活用して、業務やプライベートを充実させていきましょう。

14
1
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
14
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?