オンプレミスAgenticSearch(Windows+Python+Qdrant+OpenAI互換API)

Last updated at 2026-03-15Posted at 2026-03-15

自分用保存のため

On-premise Agentic Search System

社内ドキュメント(PDF, Markdown, Text)を対象とした、オンプレミス完結型の AI 検索（RAG）エージェントシステムです。外部クラウドにデータが送信されることはありません。

git clone https://github.com/yourusername/rag-test.git
cd rag-test

py -3.11 -m venv .venv
.venv\Scripts\activate
pip install -r requirements.txt

py -3.11 -m venv .venv-webui
.venv-webui\Scripts\activate
pip install open-webui

LM Studio を開き、LLM (例: Qwen3.5-9B) と Embedding (例: bge-m3) の両方をロードします。
サーバーを起動します (デフォルト: localhost:1234)。
config.py 内の LLM_MODEL と EMBEDDING_MODEL が LM Studio 上の Identifier と一致していることを確認してください。

http://localhost:3000 にアクセスし、管理者アカウントを作成します。
Settings > Connections > OpenAI API に以下を設定します：
- URL: http://localhost:8000/v1
- API Key: dummy
モデル選択から agentic-search を選んでチャットを開始します。

Qdrant のストレージロック:
ローカルモードでの Qdrant は、同時に1つのプログラムしかデータベースにアクセスできません。ingest.py を実行する際は、必ず server.py (Agentサーバー) を停止させてください。 停止させずに実行すると RuntimeError が発生します。
統計情報の表示:
Open WebUI で tokens/s 等を表示するには、UI 設定の Settings > Interface > Always show details (常に詳細を展開) をオンにすることを推奨します。

このプロジェクトは MIT ライセンスの下で公開されています。詳細は LICENSE ファイルを参照してください。

このプロジェクトは以下のオープンソースソフトウェアを活用して構築されています：