0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

Exa AI:AIエージェント専用に作り直したニューラル検索エンジンの正体

0
Posted at

「今年、AIエージェントがWebを検索する回数が、人間による検索を上回る」——AIエージェント向けに一から作り直された検索エンジンを掲げるスタートアップ Exa(Exa Labs, Inc.、旧Metaphor) は、2026年5月20日の資金調達発表でこう宣言した。ここでいう ニューラル検索(neural search) とは、単語の一致ではなく文章の「意味」でページを探す検索のことだ。調達額は a16z(Andreessen Horowitz)主導で 2.5億ドル、評価額22億ドル にのぼる。

Exa AIが解こうとしているのは「人間用に作られた検索では、AIエージェントが詰まる」という問題だ。検索の裏側(バックエンド)だけをExaに差し替えて訓練したエージェントは、ふつうの検索エンジンを使う版と比べ、同じ性能に届くまでに使うトークン量が約69%少なく、1回の検索で答えに当たる割合が約10.7ポイント高かった——とExaは自社評価で示している(第三者の独立検証ではない)。自社でRAG(外部の文書を検索してLLMの回答に使う仕組み)やエージェントを触っていて検索の精度に悩んでいるなら、この話は明日から効く。本記事では、Exa AIが何を変え、どんな仕組みで動くのかを読み解く。

単語の一致をやめる──意味で引くニューラル検索

従来のWeb検索は、クエリに含まれる単語と、ページに含まれる単語の「一致」を主な手がかりにする。人間が結果一覧を眺めて自分でクリックする使い方なら、これで十分だった。

一方Exaの ニューラル検索 は、単語ではなく 埋め込み(embedding。文章の意味を数百〜数千個の数字の並び=ベクトルに変換したもの) でクエリとページを結びつける。意味の近さで引くので、言葉が一字一句そろっていなくても、内容として最も関連するページを返せる。意味で検索する点では、広い意味での セマンティック検索 の仲間だ。

ただし、ありふれたセマンティック検索と同じではない。一般的なベクトル検索は、どんな用途にも使える「汎用の埋め込み」をそのまま使う。Exaはそうではなく、後で述べるように Web上の実在リンクを教師にして学習させた専用の埋め込み を使う。この学習の中身こそがExaの正体だ。

「次に貼られるリンク」を当てる──ニューラルPageRankの正体

Exaの仕組みでいちばん特徴的なのが、検索モデルの学習方法だ。Exaは、Web上に実在する リンク構造 そのものを教師データに使う。あるページの本文を読ませ、そのページが実際に張っているリンク先を当てさせる next-link prediction(次リンク予測) で、意味ベクトルを学習する。

文章生成モデルが「次の単語」を当てるよう訓練されるのに対し、Exaのモデルは「次に貼られるリンク」を当てるよう訓練される、と考えると分かりやすい。図にすると次のイメージだ。

[Web上の実在データ]   記事A ──(実際に張られたリンク)──▶ 記事B

[学習時]              記事Aの本文 ──( ? )──▶ [リンク先を隠す]

[予測課題]            「この本文の次に、人間ならどのページを貼るだろう?」
                          └─ 正解(記事B)に近い埋め込みを学習

人間が「良い」と判断して張った大量のリンクを正解に使うため、人間が価値を認めるページに近い意味ベクトルが育つ。Exaの開発者はこれを 「ニューラルPageRank」 と呼ぶ。PageRankとは、Webページの重要度を被リンク(ほかのページから張られたリンク)の多さで測る、Google創業期の古典的な仕組みのことだ。その意味版・学習版だと捉えると腑に落ちる。従来のPageRankより強力だと開発者は主張するが、これはExa側の主張で、第三者の評価ではない。

毎分更新する自前インデックスと、速さで選ぶ3つのモード

優れた学習も、Web規模で動かなければ実用にならない。Exaは検索を外部に頼らず、すべて自前で 作っている。Exa 2.0(2025年10月発表)の公式ブログによれば、数百億ページを解析して 毎分更新 し、意味ベクトルを高速に探す専用のデータベースを、速度を稼ぐために自社実装したという。

使う側は、速度と深さで3つのモードを選べばよい。速さ最優先なら Fast(公式値で応答時間の中央値が350ミリ秒未満)、速度と品質のバランスをとる既定が Auto、エージェントが何度も探り直して最高品質を狙うなら Deep、と覚えれば足りる。

誰がExaを使っているのか──用途で分かれる採用

Exaは、AIエージェントを作る企業に検索の裏側(Exa Search)として採用されている。ただし各社の具体的な組み込み手順までは公開されていないため、ここでは「採用の事実」と「どんな用途か」までを示す。

  • Cognition(自律コーディングエージェント Devin の開発元):Exaを検索基盤として採用している。コードを書く途中で必要になる技術文書を、意味で引いて取り込む使い方だ。
  • Cursor(AIコードエディタ):最新の技術ドキュメントの取得にExaを使う。ライブラリの新しい仕様など、キーワードでは引きにくい情報を意味で探す場面に向く。
  • HubSpot(CRM大手):営業・マーケ向けに企業や人物を網羅的に探す用途での採用。Exaはこうした市場開拓(GTM)向けに、人物・企業を広くインデックスした検索も提供している。

Exa公式やa16zによれば、採用は5,000社・40万人の開発者に広がるという。共通するのは「人間が結果をクリックするための検索」ではなく、「エージェントが意味で必要な情報を引くための検索」を求めている点だ。

exa.search() を一度叩く──4つのAPIと最小コード

最後に、Exa AIを実際にどう呼べるかをコードで見る。Exaは公式Docsで4つのコアAPIを提供している。

  • /search:ニューラル検索でWebページを見つける(本記事で見てきた入口)
  • /contents:見つけたページから、整形済みの本文を取り出す
  • /answer:質問に引用付きで直接答える
  • /research:より深いリサーチを自動化し、引用付きの構造化JSONで返す

基本となる /search を Python SDK(exa-py)から呼ぶ最小コードが以下だ。Exa APIには無料枠があり、APIキーを取ればすぐ試せる。

from exa_py import Exa
import os

# APIキーは環境変数 EXA_API_KEY から読み込む(無料枠あり / 事前に pip install exa-py)
exa = Exa(api_key=os.getenv("EXA_API_KEY"))

# 中核概念(1) ニューラル検索:キーワードの羅列ではなく自然文で意図を書ける
# 中核概念(2) 検索モード:type で速度と深さを選ぶ(既定 auto。Fast/Auto/Deepの3モード)
# 中核概念(3) 本文抽出:contents を付けると結果ページの要点(ハイライト)も返る
result = exa.search(
    "gRPCのストリーミングをRustで実装する手順を解説した最新ドキュメント",
    type="auto",
    contents={"highlights": True},
)

for r in result.results:
    print(r.title, r.url)
    print(r.highlights)

クエリ題材を「コーディングエージェントが探しそうな技術文書」にした。キーワードでは引きにくい長い自然文でも、意味で関連ページを返せるのがExaの持ち味だ。AnthropicやOpenAIのツールコーリング(LLMに外部ツールを呼ばせる仕組み)連携、MCP(AIに外部のツールやデータをつなぐ仕組み)サーバも用意されており、LLMに自律的に検索させる導線までそろう。

検索の質が、エージェントの実力を決める

Exa AIの主張を一言にすると「検索という裏方の質が、エージェント全体の精度と効率を左右する」だ。キーワード一致の人間用検索に対し、Exaは実在リンクを教師にしたnext-link predictionで意味的に最適なページを返し、自前インデックスと3つのモードでエージェント規模に応える。トークン約69%減や答え命中+10.7ポイントといった数字は、いずれもExaの自社評価(検索バックエンドだけを差し替えて、ふつうの検索エンジンを使う版と比べた値)で、鵜呑みにはできない。それでも、自分のエージェントの精度が伸び悩んだとき、モデルやプロンプトを疑う前に「検索の質」を疑ってみる——その視点を持てるかどうかは、これから自前のAIを育てる人にとって、小さくない差になる。

参考文献

  1. Exa公式ブログ - Announcing Exa's Series C - https://exa.ai/blog/announcing-series-c
  2. Andreessen Horowitz (a16z) - Investing in Exa - https://a16z.com/announcement/investing-in-exa/
  3. Latent Space - Beating Google at Search with Neural PageRank(Exa開発者インタビュー) - https://www.latent.space/p/exa
  4. Exa公式ブログ - How Search Quality Shapes RL Outcomes - https://exa.ai/blog/rl-search-outcomes
  5. Exa公式ブログ - Exa 2.0 - https://exa.ai/blog/exa-api-2-0
  6. Exa公式Docs - Welcome to Exa(Getting Started / 4つのコアAPI) - https://docs.exa.ai/reference/getting-started
  7. Exa公式Docs - Quickstart(exa.search() の最小サンプル) - https://docs.exa.ai/reference/quickstart
  8. Exa公式サイト - About(採用顧客リスト:Cursor / Cognition / HubSpot / OpenRouter / Monday.com) - https://exa.ai/about
0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?