n8nとOpenAIでRAGパイプラインを構築する方法

Posted at 2026-04-12

はじめに

RAG（Retrieval-Augmented Generation）は2026年のAI開発で最も注目されているアーキテクチャの一つです。しかし、多くの開発者がRAGの実装にはPythonで複雑なコードを書く必要があると思い込んでいます。実は、n8nを使えばノーコードでRAGパイプラインを構築でき、しかも本番環境で動かせるレベルのものが作れます。この記事では、n8nとOpenAIを使ってRAGパイプラインをゼロから構築する方法を解説します。

RAGとは何か？なぜ必要なのか？

RAGは、LLM（大規模言語モデル）に外部データを参照させる仕組みです。通常のChatGPTやOpenAI APIは、トレーニングデータの範囲内でしか回答できません。しかしRAGを使えば、自社のドキュメント、FAQ、データベースの情報を基にAIが回答できるようになります。

例えば、カスタマーサポートBotを作る場合。RAGなしでは一般的な回答しかできませんが、RAGありでは自社の製品マニュアルやFAQを参照して、具体的で正確な回答を返せます。

これがRAGの価値です。LLMの汎用的な能力と、自社固有のデータを組み合わせることで、実用的なAIアプリケーションが構築できます。

ポイント：

RAG = LLM + 外部データソース
自社データに基づいた正確な回答が可能に
カスタマーサポート、社内ナレッジベース、FAQ Botなどに最適

アーキテクチャ：n8nでのRAGパイプライン構成

n8nでRAGパイプラインを構築する場合、大きく分けて2つのワークフローが必要です。

ワークフロー1：データの取り込みとベクトル化

最初のワークフローは、ドキュメントをベクトルデータベースに格納するためのものです。テキストデータをチャンク（小さな塊）に分割し、OpenAIのEmbedding APIでベクトル化して、ベクトルストアに保存します。

[ドキュメント取得] → [テキスト分割] → [Embedding生成] → [ベクトルストアに保存]

ワークフロー2：クエリと回答生成

ユーザーからの質問を受け取り、関連するドキュメントをベクトルストアから検索し、その情報をコンテキストとしてLLMに渡して回答を生成します。

[ユーザー質問] → [Embedding生成] → [類似検索] → [関連ドキュメント取得] → [LLMで回答生成]

ポイント：

2つのワークフローが必要：取り込みと検索
データはベクトル化して保存
ユーザーの質問もベクトル化して類似検索

実装：ステップバイステップ

ステップ1：データの準備

まず、RAGに使うデータソースを決めます。Google Drive、Notion、PDF、Webページなど、n8nのノードで取得できるものなら何でも使えます。

// 例：テキストをチャンクに分割する
const text = $input.first().json.content;
const chunkSize = 500;
const overlap = 50;
const chunks = [];

for (let i = 0; i < text.length; i += chunkSize - overlap) {
  chunks.push({
    json: {
      chunk: text.slice(i, i + chunkSize),
      index: chunks.length,
      source: $input.first().json.fileName
    }
  });
}

return chunks;

このコードの動作：
長いテキストを500文字ずつのチャンクに分割します。50文字のオーバーラップを設けることで、チャンク間のコンテキストが失われるのを防ぎます。

ステップ2：ベクトルストアの設定

n8nでは、Pinecone、Supabase、Qdrantなどのベクトルストアに対応しています。ここではSupabaseを例に説明します。Supabaseは無料プランがあり、pgvectorエクステンションでベクトル検索が使えます。

n8nのSupabase Vector Storeノードを使えば、Embeddingの保存と検索がノーコードで実現できます。

ステップ3：検索と回答生成

ユーザーの質問が来たら、同じEmbeddingモデルで質問をベクトル化し、ベクトルストアから最も関連性の高いチャンクを取得します。そして、取得したチャンクをコンテキストとしてOpenAIに渡します。

{
  "role": "system",
  "content": "以下のコンテキストに基づいて質問に回答してください。コンテキストに情報がない場合は「その情報はありません」と回答してください。"
},
{
  "role": "user",
  "content": "コンテキスト：{{取得したチャンク}}\n\n質問：{{ユーザーの質問}}"
}

このプロンプトの動作：
LLMに外部データのコンテキストを与え、そこに基づいた回答のみを生成させます。これにより、ハルシネーション（でたらめな回答）を大幅に減らせます。

ポイント：

データソースはn8nのノードで柔軟に取得可能
チャンク分割はオーバーラップを設けるのがベストプラクティス
システムプロンプトでコンテキストに基づく回答を強制

実践的なヒントと注意点

RAGパイプラインを本番環境で運用する場合、いくつかの重要なポイントがあります。

チャンクサイズの調整は最も影響が大きい設定です。小さすぎるとコンテキストが失われ、大きすぎると検索精度が落ちます。ドキュメントの種類に応じて300〜1000文字の範囲でテストするのがおすすめです。

メタデータの活用も重要です。各チャンクにソースファイル名、セクション名、日付などのメタデータを付与しておくと、検索結果のフィルタリングや回答の引用元表示に使えます。

エラーハンドリングを忘れないでください。OpenAI APIのレート制限、ベクトルストアの接続エラー、空の検索結果など、本番で起こりうるエラーに対応するノードをワークフローに追加しておくことが大切です。

ポイント：

チャンクサイズは300〜1000文字の範囲でテスト
メタデータを付与してフィルタリング・引用元表示に活用
本番運用にはエラーハンドリングが必須

まとめ

RAGパイプラインの構築は、n8nを使えばPythonのコードを一行も書かずに実現できます。トリガー、HTTP Request、Code、AI Agentなどの基本ノードを組み合わせるだけで、ドキュメントの取り込みからベクトル検索、AI回答生成まで一連の流れを構築できます。

体系的にn8nのノードとAIエージェントの構築を学びたいなら、Eight Universityがおすすめです。41レッスンでゼロからAIエージェント構築まで網羅しており、RAGの実装も含まれています。自分がRAGパイプラインをスムーズに構築できるようになったのは、ここで基礎を固めたおかげです。

次のステップ：

まずはシンプルなFAQ Botから始めてみる
Supabaseの無料プランでベクトルストアをセットアップ
Eight Universityで体系的にn8nとAIエージェントを学ぶ

リソース

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up