今年のはじめごろ、GoogleがGemini上で「Deep Research」機能を先行公開し、Advancedプランのユーザー限定で利用できるようにしました。その後先月2月には、OpenAIとPerplexityも独自のDeep Researchをリリースしました。
では、そもそもDeep Researchとは何なのか。どうして各AIサービスがこぞってこの機能を導入しているのか。そして、昨年末に一躍話題を集めたDeep Searchとは何が違うのか。本記事では、これらの疑問に答えるために、両者の特徴や使い道を詳しく解説していきます。
1.Test-Time Compute (テストタイム計算)
DeepSearchやDeepResearchを理解する前に、まず知っておくべき概念が"Test-Time Compute"です。これらの機能はどれもTest-Time Computeを前提に設計されています。
Test-Time Computeという考え方が最初に提唱されたのは、昨年9月にOpenAIが「o1-preview」モデルを発表したときタイミングで、具体的には事前学習やファインチューニングに過度なリソースを投入するのではなく、推論段階(Resoning)で大きなリソースを使って高度な処理を行うという手法です。
たとえば、Chain-of-Thoughtのような「自分で考えながら推論する」プロセスをモデルが実行できるようにすることで、最終的な出力品質を大幅に向上させられることが分かっています。もちろん推論に時間はかかりますが、最近のLLMをよく使いますと、モデルの「thinking」プロセスをある程度待つことに慣れてきましたし、結果さえ良ければ、多少待ち時間が長くても受け入れられるという流れになりつつあるのです。
Test-Time Computeについてさらに詳しく知りたい方は、以下のHugging Faceのブログ記事を参照してください。
2. Deep Searchとは何か
DeepSearchは、いわば「ハイレベルなWeb検索エージェント」と言える存在です。従来のWeb検索エージェントは、与えられた検索ツールを使って情報を集め、その情報をもとに回答を作るという仕組みでして、基本的に検索は一度のみ実施します。しかしDeepSearchでは、検索プロセスに「推論(reasoning)」を挟むステップが加わっています。
大まかに言えば、「検索 → 推論 → 検索 → 推論…」という一連のサイクルを繰り返して、正解と思われる答えに到達するか、もしくはToken上限に達するまで動き続けるという仕組みです。
下記の図で、DeepSearchエージェントと従来のWeb検索エージェントの処理フローをまとめてみました。最大の特徴は複数回の検索と推論を行うことで、精度の高い回答を導き出せる点にあります。
なお、推論(reasoning)については、OpenAIが以下のページで詳しく解説しています。
3. Deep Researchとは何か
一方で、DeepResearchはDeepSearchを有効活用するうえでの代表的な事例と言えます。 その主な目的は「研究レポートを自動生成する」ことです。ユーザーから与えられたテーマをもとにまず大まかな章立てを計画し、各章で必要となる情報をDeepSearchを使って検索・推論します。最後に、集めた情報をLLMで整理・統合して、最終的な研究レポートとして仕上げる流れです。
4. DeepSearch vs DeepResearch
最後DeepSerachとDeepResearchの関係と違いについて、一言でまとめると、DeepSearchはこれから主流となる新しいAI検索手法であり、DeepResearchはそのDeepSearchを使いこなした一つの応用例です。 研究レポートの作成は本来、多くの時間がかかる作業ですが、各AIサービスがDeepResearch機能をリリースし始めたことで、今後は短時間で質の高いレポートを作ることが可能になると想定します。
DeepSearchの処理時間がやや長くても、徹底的な情報収集と推論によって高品質な結果を得られるなら、十分受け入れられるはずだと考えています。
またLangChainも先日、独自のDeepResearch実装をオープンソースとして公開していますので、興味がある方は以下をチェックしてみてください。
追記:
本日(3/15)からGeminiのDeep Researchは無料プランにも開放し、すべてのユーザーが利用可能になりました。