はじめに
先週ぐらいからネットニュースでしきりに目にする NotebookLM
という言葉について、気になったので少し調べてみました。
提供元の Google によれば、
NotebookLM は、ユーザーの思考をサポートするパーソナライズされた AI コラボレーターを提供します。ドキュメントをアップロードすると、NotebookLM がこのソースの即席の専門家となります。ユーザーは NotebookLM といっしょにドキュメントを読む、メモを取る、共同作業をするといったことを通じて、アイデアを練ったり、整理したりできるようになります。
NotebookLM は、Gemini API が利用可能な 180 以上の地域のすべてのユーザー(18 歳以上)が利用できます。
とのこと。
自分だけの専用データソースを使って Google の生成AI(Gemini)が使えるサービスと言えそうです。具体・詳細についてはインターネット上に優れた記事・動画が溢れているのでそちらに譲るとして「なんか BizRobo! の日々の運用で使えるのでは?」と思い、30分程度触ってみました。
使い方
こちらもネット上の他の記事や動画が詳しいですが、Google のアカウントさえ持っていれば追加の情報登録は必要とせず、サービスのトップページから「Try NotebookLM」ボタンをクリックすれば使い始められます。
ただ、タイトルにも「NotebookLM(EXPERIMENT
)」と書いてあるように試験版なので、今後正式版に転換するかも未定なうえ、有料化されるのかどうかも不明です。
とはいえ、今後の生成AIにおける一つの流れだと思うので、感覚を得るためにも触ってみるのは有用だと思います。
登録可能なデータソース
BizRobo! の相談役を作るとして、どんなデータを登録すればいいでしょうか。
学習教材としては、e-learning やナレッジベース、そして MyBizRobo! からダウンロードできるドキュメントなどが公式には存在します。
NotebookLM
に対して登録できるデータソースは以下の通りで、PDF
はファイルによってうまく読み込めないものもありました1。会話で扱えるのは文字情報だけ2なので、文字情報だけをまとめたテキスト ファイル
をアップロードするのが効率的かもしれません3。
あと、ウェブサイト
を指定する場合には、サイトのトップページURLではなく、読みこむページのURLを指定します。
今回は適度なボリュームのコンテンツが1冊にまとまっている、「BizRobo!ファーストステップガイド_ver1.1.pdf」と「別冊ファーストステップガイド MC編_第1.0版.pdf」を MyBizRobo! からダウンロードし、データソースとして活用してみます。4
データソースの登録
データソース登録時の注意
以下、盾のアイコンをマウスオーバーすると画面に表示される文言です。
ユーザーの個人データが NotebookLM のトレーニングに使用されることはありません。人間のレビュアーは、トラブルシューティング、不正使用への対応、フィードバックに基づく改善を行うために、クエリ、アップロード、モデルの回答を確認することがあります。人間のレビュアーに見られたくない情報は送信しないでください。
データがトレーニングに使われることはないようですが、匿名の人間には見られてしまうので、扱うデータには気を付けましょう。
データソース登録
データソースを登録すると左ペインにデータソースが追加されていきます。
また、画面下部には「よくありそうな質問」が自動的に提案されます。
読み込んだデータソース「BizRobo!ファーストステップガイド_ver1.1.pdf」をクリックすると、リアルタイムで 要約
と トピック
を生成してくれます。
要約部分の下には読みこんだデータソースの全文が表示されます。
PDF
の場合、改行などのフォーマット情報も含んでしまうので、ちょっとデータ容量的に勿体なさも感じますね。
チャットを実行してみる
何個か質問をしてみます。
ふむふむ。
回答の中に ①
のような注釈が表示されます。
マウスオーバーしてみるとデータソースのどこを根拠としているかがポップアップされます。また、クリックすることで左ペインが切り替わり、本文中の該当箇所をマーキングしてくれます。
また、データソースには書かれていない質問をしてみたところ、
提供されたソースに「〇〇〇〇」に関する情報は含まれていません。
という回答が返ってきます。生成AIでありがちなハルシネーションを防ぐ仕組みになっているようです。
まとめ
今回は30分程度トライアンドエラーで触ってみただけですが、「なるほど、データソース絞るとこんな感じなのか。」と具体的な第一印象を得ることができました。
やはり、どれだけデータソースの質を高められるかが重要だなと思う一方、事前にそれを用意するというよりも、関係者間で共有して育てていくた方が良さそうだなと感じました。
特に、提供されたソースに「〇〇〇〇」に関する情報は含まれていません。
という返答は重要で、どんな質問がされたのかという情報は集中的に集めて、それに対する回答を社内で作っていくことによって精度を上げていくのが効率良さそうだな。。と。
上記の様に「情報ないです」の回答を得た質問については 回答欄右上のピン
をクリックすることで、メモとしてノートに保存されるので、一旦は足りていない情報の収集を徹底する感じでしょうか。
ピン
をクリックして保存しない場合。チャットのやり取りは画面をリロードすると消えてしまうので注意が必要ですね。