昔の検索エンジンはなぜこんなに頑固だったのか？ Embedding がもたらす「意味が伝わる」世界

Last updated at 2025-12-08Posted at 2025-11-29

こんにちは、みなさん。
今日は、インターネット黎明期や検索機能を作ったことのあるエンジニアなら一度は経験したであろう「ある苦しみ」について話したいと思います。

それは、コンピュータが「文字は理解するけど意味は理解しない」時代の話です。
この問題こそ、Embedding（埋め込み表現）が生まれた最大の理由でした。

ちょっと昔話に付き合ってください。

昔の検索エンジンは「文字列」にしか興味がなかった

ある EC サイトを作っているとします。
データベースには商品名として 「メンズ高級デニムパンツ」 と登録されています。

一方、ユーザーは検索欄にこう入力します：

「ジーンズ男性用」

しかし結果は——

「該当する商品はありません」

ユーザーは 2 分眺めて離脱…。
「デニムもジーンズも同じ意味なのに？」と思いますよね。

でも当時の検索システムは、ただの Keyword Matching（キーワード一致） でした。

コンピュータにとっては：

という状態でした。

つまり、人間がコンピュータの都合に合わせて“正しい単語”を入力しないといけなかったのです。

Embedding は、単語をただの文字列ではなく、
多次元空間のベクトル（座標）として表現する技術です。

この空間では：

という自然な関係が生まれます。

例えばイメージとして（あくまで例です）：

文字列ではなく、意味の位置関係で単語が表現されるようになった瞬間です。

例の検索システムに戻ってみましょう。

ユーザーが「ジーンズ」と入力すると：

つまり AI は、
単語そのものではなく“意味の距離”でマッチングする のです。

Embedding は、現代の多くのサービスを支える重要技術になりました。

コンピュータは、
「文字一致マシン」→「意味を理解するアシスタント」
へと進化したのです。

Embedding によって、
人間の言語とコンピュータの言語の間にあった大きなギャップが埋められました。

次に Google で曖昧な検索をしても正しい結果が返ってきたら、
裏側で頑張っている数千次元のベクトルたちに、少しだけ感謝してあげてください。

もし興味があれば、
「OpenAI Embeddings を使って 5 分で作るセマンティック検索エンジン」
という実装記事も書こうと思います。

「読みたい！」という方はぜひコメントください 🙌