2024年6月6日にNotebookLMの日本語版が公開されて、一部界隈では話題となっています。NotebookLMとはなんぞや?それっておいしいの?というのを簡単にまとめてみました。
NotebookLMとは
こちらがGoogleから公式にNotebookLMの日本語版が公開されたとアナウンスがあった記事です。
ざっくりベースでは、昨年サービスが発表されてしばらく英語圏でプレリリースされていたものがGAしたような扱いのようです。また、公式ページによるとNotebookLMという製品が開発された経緯は、下記の通り色々な資料を横断的にAIが理解してくれて人間のサポートをするためのツールといったところでしょうか。
私たちが NotebookLM で目指してきたのは、複雑な資料を理解して精査し、情報から新しい類似性を見つけ、下書きなどをすばやく作成するのに役立つツールの開発です。研究論文や取材記録、仕事でのドキュメントなどの参照文献(ソース)をアップロードすると、NotebookLM がそれらの重要な資料を理解し、必要なサポートを提供します。
実際に、Google Gemini ProやClaude Opus、ChatGPTなど、この1年の間に様々なAIエンジンでファイルの読み込みやURLの参照がサポートされ、読み込んだ情報をRAGのような参考情報として使用し、より精度の高い回答を目指すといった流れのうちの一つではないかと推測されます。また参照できるものとしては、テキストやPDFのようなファイルだけでなく、スライドやドキュメント内の画像、グラフ、図についてもその情報を参照し、質問ができるようです。バックエンドのAIエンジンがマルチモーダルに対応したGemini 1.5 Proだからこういった様々なファイルやメディア形式へ対応しているようです。
使ってみよう
NotebookLMを個人で利用する場合はGoogleのアカウントがあれば今のところは使えそうです。企業向けではGoogle Workspaceなどの環境が必要になりそうです。
画面を開いた後に、Try NotebookLM をクリックするだけ。簡単ですね。
![](https://qiita-user-contents.imgix.net/https%3A%2F%2Fqiita-image-store.s3.ap-northeast-1.amazonaws.com%2F0%2F3620986%2Ff636cc67-30c5-b853-b71f-d71a66ddb65f.png?ixlib=rb-4.0.0&auto=format&gif-q=60&q=75&s=00fd069629eccca510d44f072b66abeb)
初めて画面を開くと、下記のような画面が表示されるかと思いますので、とりあえず新しいノートブックをクリックします。
![](https://qiita-user-contents.imgix.net/https%3A%2F%2Fqiita-image-store.s3.ap-northeast-1.amazonaws.com%2F0%2F3620986%2F8025c315-6e03-07db-8bb9-3583f6d4e3d7.png?ixlib=rb-4.0.0&auto=format&gif-q=60&q=75&s=7aa918fe0dd4ddca61f1c7cc2cce4fbe)
次に、アップロード元を指定してアップロードします。例えばPDFファイルをアップロードすれば、そのPDFファイルに書かれた内容をベースにAIと会話できますし、Google Drive からファイルを参照したり、テキストファイルなどを指定したりもできます。またURLなどを指定することもできますので、どこかのページに書かれている理解しがたい情報を参照させてAIに要約させるといったこともできます。
![](https://qiita-user-contents.imgix.net/https%3A%2F%2Fqiita-image-store.s3.ap-northeast-1.amazonaws.com%2F0%2F3620986%2F09b73920-6896-4e98-0a4e-e9d995119216.png?ixlib=rb-4.0.0&auto=format&gif-q=60&q=75&s=c63e12a169745ce8f3e23aae4725880c)
せっかくなので、今回はURLで試してみましょう。URLをクリックすると下記のようなダイアログが表示されURLを入力することができます。ここにURLを貼り付けるとそのURLの情報を参照してくれます。
![](https://qiita-user-contents.imgix.net/https%3A%2F%2Fqiita-image-store.s3.ap-northeast-1.amazonaws.com%2F0%2F3620986%2F03908a52-7450-21c8-fe11-e35697d83b07.png?ixlib=rb-4.0.0&auto=format&gif-q=60&q=75&s=d50981a59e47aec37f78366a4f2b8a6c)
Gemini Proのコンテキストウィンドウは最大100万トークンありますので、よほどデカいファイルでない限りはだいたい最後まで解析できると思います。
ちょうどいいページがなかったので、今回はサンプルとしてこちらのページを読み込んでみました。
URLをセットすると、下記のように概要を表示してくれます。
![](https://qiita-user-contents.imgix.net/https%3A%2F%2Fqiita-image-store.s3.ap-northeast-1.amazonaws.com%2F0%2F3620986%2F34eca46d-9b45-4425-ad34-5f02b3c52446.png?ixlib=rb-4.0.0&auto=format&gif-q=60&q=75&s=505b56f9161de09bdc568e0361e049d9)
あとは必要そうなURLをポチポチ追加することで、自分専用のカスタムチャットくんが完成です。今回はGeminiのプロンプトガイドをひと通り読み込ませましたので、これを使うとガイドラインやプロンプトについて質問して自分の理解を深めたり、自分の作成したプロンプトがガイドラインに沿っているか確認できたりといったようにプロンプト作成を支援してくれるというわけです。
![](https://qiita-user-contents.imgix.net/https%3A%2F%2Fqiita-image-store.s3.ap-northeast-1.amazonaws.com%2F0%2F3620986%2F2b96a756-3c25-da04-bc7a-8bbb508dc239.png?ixlib=rb-4.0.0&auto=format&gif-q=60&q=75&s=6bef8def8450567f477591ec63e0085d)
あくまでも上記は一例ですが、例えば試験範囲のファイルやそのベースとなる技術について書かれているファイルを一緒に読み込ませると、読み込ませた情報を基にした試験問題や出題範囲の技術情報を出すようなこともできるでしょう。
また、英語の論文を読み込ませて日本語で回答させたり、読みにくい官公庁の資料を読ませて概要をさくっと把握するようなこともできるでしょう。
AI+独自RAGは使い道が多くてとても役にたつ機能ではありますので、どんどん使っていきたいと思います。