NotebookLMのPDFを編集可能なパワポにしたくて、Gemini APIで自作ツールを作った話

Last updated at 2025-12-31Posted at 2025-12-31

最近、Googleの NotebookLM を活用していますが、
「出力がPDFなどで、PowerPoint形式に対応していない」 ことが難点でした。

社内の報告資料や、ちょっとしたプレゼンに使いたい時、PDFのままだと扱いづらいことがあります。「ここのテキストをちょっと直したい」「レイアウトを調整したい」と思っても、PDFだとなかなか手軽にはいきません。
NotebookLMさんは漢字が正しく出力されないという問題もありますよね。

既存ツールの壁

「PDF to PPTX」で検索すれば、たくさんの変換ツールが出てきます。しかし、実際に試してみると…

あちこちのツールを試して回るのも面倒になってきました。

「探すのも面倒だし、自分で作った(AIさんに作らせた)方が早いのでは？」

というわけで、勢いでAIに課金しました。今さらですが、変換ツール作成です。

PDFや画像（JPG/PNG）を、レイアウトを保持したまま編集可能なPowerPoint (.pptx) に変換するツール です。

レイアウト解析には Google Gemini API (Gemini 3.0 Flash) を使用しています。
従来のOCRとは異なり、AIが「これはテキストブロック」「これは図表」と意味的なまとまりで認識してくれるため、PPTX上で編集しやすい形 で出力されるのが特徴です。

AIの精度的に多少のズレや、文字サイズの大小は発生するので、そこは修正必要ですが色々な手間は大幅に削減されると思います。

論より証拠ということで、変換の様子です。

AIがレイアウトを認識しているので、人間が見たままに近い形でスライド化されています。

ソースコードはGitHubで公開しています。
もし同じ悩みをお持ちの方がいればどうぞ。

NotebookLMで生成したサマリーをこのツールに放り込めば、あっという間に編集可能なスライドのたたき台が完成します。
「とりあえず動けばいい」精神で作ったツールです