LangChainを学びたい(Step5:入力の柔軟化（Step5:RAGの概要を学ぶ）)

Posted at 2025-11-24

はじめに

前回までの続きになります。今回はRAGを使って図鑑の検索を進めていきます！そもそもRAGの定義があいまいな理解な部分もあるので、今回もChatGPTに教えてもらいながら進めていきます！

AI が外部データを検索して、その情報だけを使って答える仕組み。

ChatGPT や Gemini の「記憶」で答えるのではなく、
あなたが用意した JSON・PDF・テキスト・DB を参照して回答を作る AI。

→ちょっとまだイメージがあやふやなので、図とか書きながら理解を深めていきます！！

RAGは大きく3つのフェーズがあります。知識ベースの準備,ユーザー質問の理解と検索,回答の生成。フローにまとめると以下のような図になります！

まず最初に行うのは、AI が参照できる専用の“図鑑DB”を作ることです。
ここは料理でいう「仕込み」にあたる工程。

「AIがあとで参照できる知識の土台をつくる」フェーズ。

LLMに“覚えさせる”のではなく、
**「参照できる資料を外に用意しておく」**という考え方が重要です。

次に、ユーザーから質問が来たとき、
その質問の意味を解釈し、ナレッジベースから必要な情報を取り出します。

「ユーザーの曖昧な質問を、機械が検索できる形に変換する」フェーズ。

検索の結果取り出されるのは、
回答の材料（コンテキスト） です。

この材料を使って、次のステップで回答が作られます。

最後に、Step2で取り出した“材料”をもとに、
AI（Gemini/GPT）が文章として回答を作成します。

この2つを LLM に渡す。

など、多様なアウトプットが可能。

「検索で集めた“事実”だけを使って、自然な文章を作る」フェーズ。

今回は、RAGの概要を学びました！次回からは実際にベクトルDBを使って実装をしていこうと思います！！