未来を感じたNLWebを触ってみた

Posted at 2025-05-30

こんにちは。
クリエーションラインのKodakです。

Microsoft Build 2025で発表された NLWeb にとても未来を感じたので、さっそく触ってみました。

NLWebとは？

Natural Language Web（NLWeb） の略で、Webサイト上に会話型インターフェースを簡単に構築できることを目的としたオープンソースプロジェクトです。

「HTMLがWeb上で共有できるドキュメントとして標準化されたように、今度はAI Webの基盤を構築したい」
――そんなミッションを掲げているようです。

たしかに、Web上でAIと自然に会話して、欲しい情報をすぐに取得できるようになれば、かなり便利になりますよね。

これまでのような「入力」「検索」「クリック」といった操作から、
「会話するだけで情報が得られる」――そんな未来がやってくるのでは？と期待しています。

また、先日Googleが発表した Agent2Agent（A2A） を組み合わせれば、
AIエージェント同士がNLWeb上で会話し、最適な回答を導き出す ―― そんな世界も見えてきます。

ローカル環境でNLWebを動かしてみます。
NLWebでは ベクターデータベース を使用するため、Embedding用のモデルが必要です。

2025年5月時点では、Azure、OpenAI、Gemini、Snowflake に対応しています。
これらを使うのが良さそうです。（AWS Bedrock も早く対応してほしいですね）

git clone https://github.com/microsoft/NLWeb
cd NLWeb

README.md だとvenv使っていますが、poetryの方が使い慣れているため、poetryを使いました。

cd code
poetry init
poetry add $( cat requirements.txt )

.envを作成し、使用するモデルのAPI_KEYを入れます。
私は、Embedding用のモデルも使えるOpenAIのAPI_KEYを設定しました。

cp .env.template .env

code/config_embedding.yaml ここで、Embedding用のモデルを選択します。

# code/config_embedding.yaml

- preferred_provider: azure_openai
+ preferred_provider: openai

code/config_llm.yaml ここで会話用のモデルを選択します。

# code/config_llm.yaml

- preferred_provider: azure_openai
+ preferred_provider: openai

code/config_retrieval.yaml ここでベクターDBを選択します。ローカルで動かしたいので、ローカルで動くQdrantを選択します。

# code/config_retrieval.yaml

- preferred_endpoint: azure_ai_search
+ preferred_endpoint: qdrant_local

今回は、自分のはてなブログのRSS をデータとして投入しました。
tools.db_load の引数として <データのURL> と <サイト名> を指定します。
この <サイト名> は、データに対するラベルのようなもののようです。

現時点では、さまざまな種類のデータを柔軟に扱える設計にはなっていないようなので、今後のアップデートに期待ですね。

python -m tools.db_load https://kodak.hatenablog.com/rss kodak-rss

最後に起動してみます。

python app-file.py

Ask からAIとの会話が可能で、きちんと応答してくれました。

👋