Supabaseを用いたRAGをIBM Cloud CodeEngineでセルフホストするまで

Last updated at 2025-05-18Posted at 2025-05-18

はじめに

以下のように、人気の「Dify」を使ってRAGを用いたチャットボットをつくり、AIアバター等につなげて運用していたのですが、運用が長くなってくると、RAGに用いるドキュメントをデータベースとして運用管理したくなります。

そこで、セルフホスト版と、パブリッククラウドの両方で運用でき、PostgreSQLベースのSupabaseで、RAGに用いるドキュメントを運用管理することにしました。このように、表形式で管理できることで、運用管理の生産性が向上します。

（あくまで個人的な感想です。LLMおよびSLMのファインチューニング向けデータを作ることもあるので、表形式で管理できると安心します。）

Flowiseを選択した理由

Supabaseを使う影響で、Supabaseに対応する、Difyに代わるAIエージェント作成ツールとして、Flowiseを使うことにしました。Supabase対応以外にも、Flowiseを選定した理由があります。

1. IBM watsonx.aiにつなげることができる
Flowiseでチャット等を実現する際に、watsonx.aiにつなげるノードがあります。

2. Supabaseをはじめとして、RAGにおけるベクトルストア（ベクトルデータベース）の選択肢が多い
この点はDifyにはできないこと。
https://docs.flowiseai.com/integrations/langchain/vector-stores

3. GraphRAG 対応
Neo4jによるグラフデータベースをつなげることができるので、通常のRAG以外に、Graph RAGもいけます。

DifyでもAPI連携をがんばればできなくもないですが、ツール側で用意されていることで、取り組みやすさはあります。

IBM Cloud CodeEinge でセルフホスト

Flowiseには、パブリッククラウド版がありFree版もあります。
現在運用している生成AIアプリが、個人情報ではありませんが、アプリを使う人にとっては信頼できる場所で運用されていることが重要な情報になりますので、セルフホスト環境である必要があります。
以前に、IBM Cloud上の仮想マシンでFlowiseを動かしたことがありますので、今回は、サーバーレス環境でもあるIBM Cloud CodeEngine上でFlowiseを動かしてみることにします。

下準備を行う

Flowiseを使って今回作るRAGを用いたチャットボットは、RAGのベクトルストア（ベクトルデータベース）としてSupabase、LLMの部分にGoogle Geminiを使うことにします。

完成図

Supabaseは、今回はパブリッククラウド版を使いますが、セルフホスト版に切り替えることができます。
LLM部分は、watsonx.aiやOllamaを使ったIBMのLLMである、「Granite3.3」などに変更して動かすこともできます。「Granite4.0」は、この記事を書いている段階ではプレビュー版の状態でした。

Supabaseの準備

今回はパブリッククラウド版を使います。セルフホスト版をつなげる方法は次回以降にあつかいます
Flowiseのオンラインヘルプに、FlowiseにおけるSupabaseの設定ついて説明したドキュメントがあるので、それを参考にSupabaseのテーブルを作成します。
上記のドキュメントとは異なり、テーブルに格納するデータは日本語にしました。

Google GeminiのAPIキーを取得

Google AI Studioにアクセスし、GeminiのAPIを使うために必要なAPIキーを取得してください。

CodeEngineで、RAGを用いたチャットボットをつくる

まずは、CodeEngine上でFlowiseを起動し、その後、チャットボットを作成していきます。

CodeEngineで認証機能付きのFlowise環境を構築する

サーバーレスであるCodeEngineを用いて、Flowiseの実行環境をつくっていきます。
IBM Cloud Catalogで、CodeEngineを選びます。

「Start creating」をクリックします。

「Create project」をクリックします。

画面右側に「Create Project」が表示されるので、Locationなどを選び、「Create」をクリックします。

画面中央に戻り、「Component type」に「Application」を選びます。

「Name」に「Flowise」と入力します。

Codeの「Use an existing container image」を選び、「Image reference」の項目に、以下を入力します。

docker.io/flowiseai/flowise:latest

下図のようになるはずです。

試しに動かすレベルであれは、リソース設定についてはそのままでも良いですが、安定して運用する場合は「Min number of instances」の数値を「0」→「1」にしましょう。

画面下に移動し、「Optional settings」の「Environment variables」をクリックします。

環境変数を設定し、Flowiseの画面にアクセスしたとき、あらかじめ設定したユーザー名とパスワードで認証が行われるようにします。
「Add」をクリックします。最初はユーザー名の設定です。

「Literal value」を選び、

「Environment variable name」の値として、「FLOWISE_USERNAME」を入れます。
「Value」の値として、「admin」を入れます。admin以外でも構いませんので任意のユーザー名にします。

その後、「Add」をクリックします。
同じ動作で、パスワードを設定します。

「Environment variable name」の値として、「FLOWISE_PASSWORD」を入れます。
「Value」の値として、「zxcvfr45」を入れます。この値はあくまで例です。適切な文字数のパスワードにしましょう。

結果として、このように設定されているはずです。

画面右側の「Summary」に表示されている、「Create」をクリックします。

「Ready」の状態が表示されるまで待ちます。

「Ready」と表示された後、画面右側の「Test application」>>「Application URL」の順にクリックします。

Flowiseのログイン画面が表示されるので、先ほど設定した「FLOWISE_USERNAME」と「FLOWISE_PASSWORD」のそれぞれの値を入力し、「Login」をクリックします。これで、Flowiseの画面を使う際に認証を行う、少しだけセキュアな環境が手に入りました。

ログイン後は、Flowiseの通常画面が表示されるので、「Add new」をクリックして、チャットボットをつくりましょう。

Flowiseで、RAGを用いたチャットボットをつくる

CodeEngineで稼働するサーバーレスなFlowise実行環境が手に入りましたので、SuapbaseやGoogle Geminiを使って、RAGを用いたチャットボットをつくっていきます。

Flowiseの画面で「Add new」をクリックすることで、1つ目の「Chatflow」をつくることができます。

画面左上の「＋」をクリックすることで、様々なノード（箱状のもの）を追加し、ノードを複数配置して線で結ぶことでチャットボットとして動かすことができます。

Supabaseノードの配置

Supabase環境に接続するノードを、画面の余白部分にドラッグ&ドロップで配置します。

配した「Supabase」ノードについて、「Connect Credential」の「▼」をクリックします。

「Create New」をクリックします。

「Supabase API」の画面に表示される各項目に必要な値を入力します。

「CREDENTIAL NAME」：英数字で任意の値を入力します。例 Supabase
「Supabase API Key」：Supabaseの画面の「Project Settings」内に「Data API」に表示される「anon」「public」に表示されている文字列をコピーして入力します。

この後の作業で使う「Project URL」の値も控えておきます。
Supabaseのノードに戻り、以下の項目に必要な値を入力します。

「Project URL」
「Table Name」
「Query Name」

Buffer Memoryノードの配置

「Buffer Memory」ノードを画面の余白部分に配置します。「Buffer Memory」ノードは、チャットボット内の会話を記録/取得するために必要です。

Googleの生成AIサービス、Gemini関係ノードの配置

「ChatGoogleGenerativeAI」ノードと「GoogleGenerativeAI Embeddings」ノードの２つを配置します。

ひとまず、２つ並べます。

Supabaseノードを設定した時と同じ要領で、それぞれのノードの「Connect Credential」の「▼」をクリックします。

「CREDENTIAL NAME」は、「ChatGoogleGenerativeAI」ノードと「GoogleGenerativeAI Embeddings」ノードは、別々の値にします。
「Google AI API Key」は、Google AI Studioで取得したAPIキーを入力します。こちらは両ノードともに同じ値です。

例として、下図のように設定します。

「GoogleGenerativeAI Embeddings」ノードの「Model Name」に「embedding-001」を選んでいます。選択できるモデルであれば、他のモデルでも構いません。
「ChatGoogleGenerativeAI」ノードでは、「Model Name」に「gemini-2.0-flash-lite」を選んでいます。選択できるモデルであれば、他のモデルでも構いません。
「Temperature」の値は、通常は1以下が推奨されます。標準では0.9が設定されており、0に近づけば近づくほど、RAGに用いるデータ（Supabase内のドキュメント）に近い結果がでるようになります。