最近、LangChainがNVIDIA AIで調査レポートを自動生成するAgentをリリースし、NVIDIA NIM上で公開したというブログをLangchainのホームページで見ました。
NVIDIA AI/NIM は以前から名前だけは聞いたことがあったのですが、実際に触ったことはなかったので、今回このAgentをきっかけに少し試してみました。
NVIDIA NIM は、NVIDIA 独自のAgent Storeのようなもので、Low Code や No Code でもAgentを作成できます。しかも、多くのオープンソースモデルが揃っており、UI もシンプルで直感的に使えるため、かなり便利だと感じました。
1. 調査レポート作成Agentのワークフロー
このAgentのワークフローは下記図の通りですが、ざっくり説明すると、まず最初にはPlanning Agent(LangGraph を使って実装)が全体のプランを組み立て、次に調査Agent(NVIDIA NIM 上で定義)を呼び出して必要な情報を収集します。調査には Tavily API を利用して検索を行い、その結果をもとにレポート生成Agent(こちらも NIM 上で定義)を用いて最終的なレポートを作成し、ユーザに返すという仕組みです。
2. Sakana AI の AI Scientist との比較
このレポート生成機能はビジネス向けの調査レポートだけでなく、学術的なレポートにも対応できるとされています。ここで「学術レポート」と聞いて思い浮かんだのが、sakanai AIのAI Scientistです。ワークフローとしてはかなり似ており、「AI Scientist の簡易版」といった印象を受けました。(⇩はAI Scientistのワークフロー)
一方、Sakanai AI の AI Scientist については、こちらの論文(https://arxiv.org/pdf/2408.06292)
で詳しく説明されています。AI Scientist はプランニング用のAgentに加え、LLM を使って実験用コードを生成し、そのコードを実行して得られた実験結果をまとめ、LaTeX 形式の論文として執筆するなど、より高度なプロセスを実現しています。それに比べると、今回のAgentはあくまで「調査」に特化しており、実行までは踏み込まない分、汎用的なレポート作成を手軽に行える印象です。
ちなみに、NVIDIA NIM 上で作成したAgentは、ワンクリックでデプロイも可能です。また、料金も「1 時間いくら」という形で可視化されているので、コスト感覚をつかみやすく使い勝手が良さそうです。
興味ある方: